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(54) Tide: QUALITATIVE DIFFERENTIAL SCREENING \ 
(54) Titre: CRIBLAGE DIFFERENTIEL QUALITATIF \ 
(57) Abstract 

The invention concerns a method for identifying and/or cloning nucleic acid regions representing qualitative differences associated 
with alternative splicing events and/or with insertions, deletions located in RNA transcribed genome regions, between two physiological 
situations, comprising either hybridisation of RNA derived from the test situation with cDNA's derived from the reference situation and/or 
reciprocally, or double-strand hybridisation of cDNA derived from the test situation with cDNA's derived from the reference situation; and 
identifying and/or cloning nucleic acids representing qualitative differences. The invention also concerns compositions or banks of nucleic 
acids representing qualitative differences between two physiological situations, obtainable by the above method, and their use as probe, 
for identifying genes or molecules of interest, or still for example in methods of pharmacogenomics, and profiling of molecules relative to 
their therapeutic and/or toxic effects. The invention further concerns the use of dysregulation. of splicing RNA as markers for predicting 
molecule toxicity and/or efficacy, and as markers in pharmacogenomics. 

(57) Abrege- 

L'invention concerne un precede d'identification et/ou de clonage de regions d'acides nucieiques representatives de differences 
qualitatives associees a des 6venements d'epissages altematifs et/ou a des insertions, delations se trouvant dans des regions du genome 
transcrites en ARN, entre deux situations physiologiques, comprenant soit l'hybridation d'ARN provenant de la situation test avec les 
ADNc provenant de la situation de reference et/ou reciproquement, soit l'hybridation d'ADNc double-brin provenant de la situation test 
avec les ADNc provenant de la situation de reference et V identification et/ou le clonage d'acides nucieiques representatifs des differences 
qualitatives. L'invention concerne egalement des compositions ou banques d'acides nucieiques representatifs de differences qualitatives 
entre deux situations physiologiques, susceptibles d'etre obtenues par le procede decrit ci-dessus, ainsi que leur utilisation comme sonde, 
pour 1' identification de genes ou molecules d'interet, ou encore par exemple dans des methodes de pharmacogenomique, et de profilage de 
molecules vis a vis de leurs effets therapeutiques et/ou toxiques. L'invention concerne aussi l'utilisation des dysregulations de l'epissage des 
ARN comme marqueurs de prediction de la toxicite et/ou de l'efficacite de molecules, ainsi que comme marqueurs de pharmacogenomique. 
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CRIBLAGE DIFFtrRENTlEL QUAL1TATIF 
Cette invention se rapporte aux domaines techniques de la 
biotechnologie, de la medecine, de la biologie et de la biochimie. Ses 
applications concernent les domaines de la sante humaine, animale et 
5 veg6tale. Plus particulierement, I' invention permet d' identifier des sequences 
d'acides nucleiques permettant de concevoir de nouveaux cribles pour 
molecules d'interet therapeutique, de nouveaux outils de therapie genique 
ainsi que d'apporter des indications sur le potentiel toxique et le suivi 
d'efficacite de molecules et des informations de pharmacogenomique. 

10 La presente invention decrit notamment une serie de 

techniques originales d' identification de sequences d'acides nucleiques 
basee sur la mise en evidence des differences qualitatives entre les ARN 
issus de deux contextes differents que Ton desire comparer, en particular 
issus d'un tissu ou d'un organe malade et leur equivalent sain. Plus 

15 precisement, ces techniques sont destinees a doner specifiquement les 
introns et les exons alternatifs episses differentiellement entre une situation 
pathologique et un etat sain ou entre deux situations physiologiques que Ton 
desire comparer. Ces differences qualitatives au sein des ARNs peuvent 
egalement provenir d'alteration(s) du genome, de type insertions ou 

20 deletions dans des regions qui seront transcrites en ARN. Cette serie de 
techniques est identifi§e par Tacronyme DAT AS : Differential Analysis of 
Transcripts with Alternative Splicing. 

La caracterisation des alterations de T expression genetique qui 
president ou sbnt associees a une pathologie donnee suscite un espoir 

25 important de d§couvrir de nouvelles cibles therapeutiques et de nouveaux 
outils diagnostiques. Toutefois, T identification d'une sequence d'ADN 
genomique ou complementaire, qu'elle ait lieu par clonage positionnel ou par 
des techniques de criblage differential quantitatif, n'apporte que peu ou pas 
d'information sur la fonction et encore moins sur les domaines fonctionnels 

30 mis en jeu dans les deregulations liees a la pathologie etudiee. La presente 
invention decrit une serie de techniques originales qui visent a identifier les 
differences d'epissages des ARNs qui existent entre deux situations 
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physiopathologiques distinctes. L'identification de ces differences apporte 
des informations sur les differences qualitatives et non sur les differences 
quantitatives comme c'est le cas pour les techniques decrites jusqu'a 
present. L'ensemble des techniques presentees dans la presente invention 
sont done regroupees sous Tappellation "criblage differentiel qualitatif" ou 
DATAS. Les methodes de 1'invention sont utilisables pour l'identification de 
nouvelles cibles ou produits therapeutiques, pour la preparation d'outils de 
recherche genetique et/ou d'outils de diagnostic, pour la construction de 
banques d'acides nucleiques, et dans des methodes de determination du 
profit toxicologique ou de I'efficacite d'un compose par exemple. 

Un premier objet de 1'invention reside plus particulierement 
dans un procede d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences genetiques qualitatives entre deux 
echantillons biologiques, comprenant une etape d'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'un premier echantillon 
biologique avec une population d'ADNc provenant d'un deuxieme echantillon 
biologique (Figure 1A). 

Comme indique ci-avant, les differences genetiques qualitatives 
peuvent etre dues a des modifications d'epissage des ARN ou a des 
deletions et/ou insertions dans des regions du genome qui sont transcrites 
en ARN. 



Dans un premier mode de realisation, il s'agit d'une hybridation 
6ntre Une P°P ulati °n d'ARN provenant d'un premier echantillon biologique et 
une population d'ADNc (simple-brin ou double-brin) provenant d'un deuxieme 
25 echantillon biologique. 

Dans un autre mode de realisation, il s'agit d'une hybridation 
entre une population d'ADNc double-brin provenant d'un premier echantillon 
biologique et une population d'ADNc (double-brin ou, preferentiellement 
simple-brin) provenant d'un deuxieme echantillon biologique. 
30 Un ob J et P ,us Particulier de ('invention reside dans un procede 

d'identification de regions d'acides nucleiques epissees differentiellement 
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entre deux situations physiologiques, comprenant I'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'une situation test avec 
une population d'ADNc provenant d'une situation de reference et 
Identification d'acides nucleiques correspondant a des epissages 
5 differentiels. 

Un autre objet de invention concerne un procede de clonage 
d'acides nucleiques episses differentiellement entre deux situations 
physiologiques, comprenant Phybridation d'une population d'ARN ou d'ADNc 
double-brin provenant de la situation test avec une population d'ADNc 

10 provenant de la situation de reference et le clonage d'acides nucleiques 
correspondant a des epissages differentiels. 

Dans un mode particulier de mise en oeuvre, le procede 
d'identification et/ou de clonage d'acides nucleiques de ('invention comprend 
deux hybridations paralleles : 

15 (a) I'hybridation des ARN provenant du premier echantillon 

(situation test) avec les ADNc provenant du deuxieme echantillon (situation 
de reference); 

(b) I'hybridation des ARN provenant du deuxieme echantillon 
(situation de reference) avec les ADNc provenant du premier echantillon 

20 (situation test); et 

(c) ('identification et/ou le clonage, a partir des hybrides formes 
en (a) et (b) d'acides nucleiques correspondant a des differences genetiques 
qualitatives. 

La presente invention concerne egalement la preparation de 
25 banques d'acides nucleiques, les acides nucleiques et banques ainsi 
obtenus, ainsi que les utilisations de ces materiels dans tous les domaines 
de la biologie/biotechnologie, comme illustre plus loin. 

A cet egard, ('invention est egalement relative a un proced6 de 
preparation de compositions ou banques d'acides nucleiques profilees, 
30 representatives des differences qualitatives existant entre deux echantillons 
biologiques, comprenant une etape d'hybridation d'une population d'ARN 



BNSDOCID: <WO 9946403A1_I_> 



WO 99/46403 



4 



PCT/FR99/00547 



provenant d'un premier echantillon biologique avec une population d'ADNc 
provenant d'un deuxieme echantillon biologique. 

L'invention concerne en outre une methode de profilage 
("profiling") d'une composition d'ADNc, comprenant une etape d'hybridation 
de cette composition avec une population d'ARN, ou inversement. 

Comme indique ci avant, la presente invention concerne en 
particulier des methodes d'identification et de clonage d'acides nucleiques 
representatifs d'un etat physiologique. En outre, les acides nucleiques 
identifies et/ou clones represented les qualites d'un etat physiologique en ce 
sens que ces acides nucleiques sont generalement en grande partie 
impiiques dans I'etat physiologique observe. De ce fait, les methodes 
qualitatives de l'invention donnent acces directement aux elements 
genetiques ou a leur produit proteique, ayant un role fonctionnel dans le 
developpement d'un etat physiopathologique. 

Les methodes selon l'invention reposent en partie sur une 
etape originale d'hybridation croisee entre des ARN et des ADNc de 
situations physiologiques differentes. Cette ou ces hybridations croisees 
permettent avantageusement de mettre en evidence, dans les hybrides 
formes, des regions non appariees, c'est-a-dire des regions presentes dans 
les ARNs dans une situation physiologique donnee et pas dans les ARNs 
dans une autre situation physiologique. Ces regions correspondent 
essentiellement a des epissages alternatifs caracteristiques d'un etat 
physiologique, mais peuvent egalement refleter des alterations genetiques 
de type insertions ou deletions, et constituent ainsi des elements genetiques 
particulierement utiles sur le plan therapeutique ou diagnostic comme 
explique ci-apres. L'invention consiste done notamment a conserver les 
complexes formes apres hybridation(s) croisee(s), afin d'en extraire les 
regions correspondant a des differences qualitatives. Cette methodologie se 
differencie des techniques de soustractions quantitatives connues de 
I'homme de I'art ( Sargent and Dawid (1983), Science, 222, 135-139 ; Davis 
et.al. (1984), PNAS, 81, 2194-2198 ; Duguid and Dinauer (1990) Nuc. Acid 
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Res., 18, 2789-2792 ; Diatchenko et.al. (1996) PNAS, 93, 6025-6030), qui 
apres hybridation(s), eliminent les hybrides formes pour ne conserver que les 
acides nucleiques non complexes. 

^invention concerne done en premier lieu un procede 
d'identification d'acides nucleiques d'interet comprenant I'hybridation entre 
les ARN d'un echantillon test et les ADNc d'un echantillon de reference. 
Cette hybridation permet de mettre en evidence, au sein des complexes 
formes, des differences genetiques qualitatives entre les situations testees, 
et ainsi d'identifier et/ou de doner par exemple les epissages 
caracteristiques de la situation test. 

Selon une premiere variante de I'invention, le procede permet 
done de generer une population decides nucleiques caracteristiques des 
epissages de I'etat physiologique test par rapport a I'etat de reference (Figure 
1A, 1B). Comme indique ci-apres, cette population peut etre utilisee pour le 
clonage et la caracterisation des acides nucleiques, leur utilisation en 
diagnostic, criblage, therapeutique ou pour la production d'anticorps ou de 
fragments proteiques ou de proteines entieres. Cette population peut 
egalement servir a la constitution de banques utilisables dans differents 
domaines d'applications illustres plus loin et a la realisation de sondes 
marquees (Figure 1D). 

Selon une autre variante de invention, le procede comprend 
une premiere hybridation telle que decrite ci avant et une seconde 
hybridation, en. parallele,- entre les ARN provenant de la situation de 
reference et les ADNc provenant de la situation test. Cette variante est 
particulierement avantageuse puisqu'elle permet de generer deux 
populations d'acides nucleiques, Tune representant les qualites de la 
situation test par rapport a la situation de reference, et I'autre les qualites de 
la situation de reference par rapport a la situation test (Figure 1C). Ces deux 
populations peuvent egalement etre utilisees comme source d'acides 
nucleiques, ainsi que comme banques temoignant de I'empreinte genetique 
d'une situation physiologique donnee, comme detaille plus loin (Figure 1D). 
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La presente invention peut etre appliquee a tous types 
d'echantillons bioiogiques. En particulier, I'echantillon biologique peut etre 
toute cellule, organe, tissu, prelevement, biopsie, etc., contenant des acides 
nucleiques. S'agissant d'un organe, tissu ou biopsie, lis sont eventuellement 
mis en culture de maniere a permettre I'acces aux cellules qui les 
composent. II peut s'agir d'echantillons provenant de mammiferes (en 
particulier Phomme), de vegetaux, de bacteries ou de cellules eucaryotes 
inferieures (levures. cellules fongiques, etc.). Des exemples de materiels 
sont en particulier une biopsie de tumeur, une biopsie de plaques 
neurodegeneratives ou d'aires cerebrales presentant des atteintes 
neurodegeneratives, un echantillon de peau, un echantillon de cellules 
sanguines obtenues apres prise de sang, une biopsie colorectal des 
b.opsies issues de lavages pulmonaires, etc. Des exemples de cellules sont 
notamment les cellules musculaires, hepatiques, fibroblastes, nerveuses de 
I'epiderme, du derme, des cellules sanguines comme les lymphocytes B, T. 
les mastocytes, les monocytes, les granulocytes, les macrophages. 

Comme indique ci avant, le criblage differentiel qualitatif selon 
la presente invention permet d'identifier des acides nucleiques 
caracteristiques d'une situation physiologique donnee (situation B) par 
rapport a une situation physiologique de reference (situation A), en vue de 
leur clonage ou autres utilisations. A titre illustratif, les situations 
physiologiques A et B etudiees peuvent etre les suivantes : 



Situation A 


Situation B 


echantillon sain 


echantillon pathologique 


echantillon sain 


echantillon apoptotique 


echantillon sain 


echantillon apres infection virale 


echantillon sensible a X 


echantillon resistant a X 
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echantillon non traite 


echantillon traite (par exemple 

nor rr>mr>r>nA trwint ia\ 

pal OUilipUoc lUXiLjUc^ 


echantillon non difference 


echantillon ayant subi une 
differentiation cellulaire ou 
tissulaire 



Populations rl'ARN 

Pour la mise en aeuvre de la presente invention, il est possible 
5 d'utiliser des ARN totaux ou les ARN messagers. Ces ARN peuvent etre 
prepares par toutes methodes classiques de biologie moleculaire, bien 
connues de Phomme du metier. Ces methodes comprennent generalement 
une lyse des cellules ou tissu ou echantilions et I'isolement des ARNs par 
des techniques d'extraction. II peut s'agir en particulier d'un traitement au 

10 moyen d'agents chaotropiques tels que le thiocyanate de guanidium (qui 
detruit les cellules et protege les ARN) suivi d'une extraction des ARN au 
moyen de solvants (phenol, chloroforme par exemple). De telles methodes 
sont bien connues de I'homme du metier (voir Maniatis et al., Chomczynski et 
at., Anal. Biochem. 162 (1987) 156). Ces methodes peuvent etre aisement 

15 pratiquees en utilisant des kits disponibles dans le commerce tels que par 
exemple le kit US73750 (Amersham) ou le kit Rneasy (Quiagen) pour les 
ARN totaux. II n'est pas necessaire que les ARN utilises soient parfaitement 
purs, et notamment il n'est pas genant que des traces d'ADN genomique ou 
d'autres composants cellulaires (proteine, etc.) subsistent dans les 

20 preparations, des lors qu'ils n'affectent pas significativement la stabilite des 
ARNs et que les modes de preparation entre les differents echantilions a 
comparer soient les memes. En outre, de maniere facultative, il est possible 
d'utiliser non pas des preparations d'ARN totaux mais des preparations 
d'ARN messagers. Ceux-ci peuvent etre isoles, soit directement a partir de 

25 I'echantillon biologique soit a partir des ARN totaux, au moyen de sequences 
polyT, selon les methodes classiques. L'obtention d'ARN messagers peut a 
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cet egard etre realisee au moyen de kits commercial tels que par exemple 
le kit US72700 (Amersham) ou le kit utilisant des billes oligo-(dT) (Dynal). Un 
mode avantageux de preparation d'ARN consiste a extraire les ARN 
cytosoliques puis les ARN P olyA + cytosoliques. Des kits permettant ia 
5 preparation selective d'ARN cytosoliques non contamines avec des ARN 
premessagers porteurs d'exons et d'introns non episses sont disponibles 
dans le commerce. C'est le cas notamment des kits Rneasy commercialises 
par Qiagen (exemple de reference : 74103). Les ARN peuvent egalement 
etre obtenus directement a partir de banques ou autres echantillons prepares 
io a Pavance et/ou accessibles dans des collections, conserves dans des 
conditions appropriees. 

Generalement, les preparations d'ARN utilisees comprennent 
avantageusement au moins 0,1 ug d'ARN, de preference au moins 0,5pg 
d'ARN. Les quantites peuvent varier selon les cellules et les methodes 
5 utilisees, sans modifier la mise en oeuvre de la presente invention. Pour 
obtenir des quantites d'ARN suffisantds (de preference 0,1 ug au moins), I 
est generalement recommande d;utiliser un echantillon biologique 
comprenant au moins 10 5 cellules. A cet egard, une biopsie ciassique 
comprend generalement entre 10 5 et 10 8 cellules, et une culture cellulaire sur 
) boite de petri ciassique (diametre 6-10 cm) comporte de Pordre de 10 6 
cellules, ce qui permet d'obtenir aisement des quantites d'ARN suffisantes. 

Les preparations d'ARN peuvent etre utilisees 
extemporanement ou etre conservees, de preference au froid, en solution ou 
congelees, pour des utilisations ulterieures. 

Populations g^Djvjc 

Les ADNc utilises dans le cadre de la presente invention 
peuvent etre obtenus par transcription inverse selon les techniques 
classiques de biologie moleculaire. On peut se referer notamment a Maniatis 
et al. La transcription inverse est generalement realisee en utilisant une 
enzyme, transcriptase inverse ("reverse transcriptase") et une amorce. 
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A cet egard, de nombreuses transcriptases inverses ont ete 
decrites dans la litterature et sont disponibles dans le commerce (Kit 
1483188, Boehringer). On peut citer a titre d'exemples les transcriptases 
inverses les plus souvent utilisees comme celles du virus aviaire AMV (Avian 
5 Myeloblastosis Virus) et du virus de leucemie murine MMLV (Moloney Murine 
Leukemia Virus). II convient egalement de citer certaines DNA polymerase 
thermostables douees d'activite transcriptase inverse telles celles isolees de 
Thermus flavus et de Thermus thermophilus HB-8 (commercialement 
disponibles; references Promega M1941 et M2101). Selon une variante 
10 avantageuse, on utilise pour la mise en oeuvre de la presente invention la 
transcriptase inverse d'AMV puisque cette enzyme, fonctionnant a 42°C 
(contrairement a celle de MMLV qui fonctionne a 37°C), destabilise certaines 
structures secondaires des ARN qui pourraient bloquer I'elongation, et 
permet ainsi la transcription inverse d'ARN de longueur importante, et permet 
15 d'avoir des preparations d'ADNc representant les ARN avec une grande 
fidelite et une grande efficacite. 

Selon une autre variante avantageuse de I'invention, on utilise une 
transcriptase inverse depourvue d'activite RNaseH. L'utiiisation de ce type 
d'enzyme offre plusieurs avantages, et notamment celui d'augmenter le 
20 rendement de synthese des ADNc et de prevenir toute degradation des 
ARN, qui seront ensuite engages dans des heteroduplex avec les ADNc 
neosynthetises, permettant ainsi eventuellement de se passer de Textraction 
phenolique- de ceux ci. Les transcriptases inverses depourvues d'activite 
RNaseH peuvent etre preparees a partir de toute transcriptase inverse par 
25 deletion(s) et/ou mutagenese. En outre, de telles enzymes sont egalement 
disponibles dans le commerce (par exemple Life Technologies, reference 
18053-017). 

Les conditions de mise en oeuvre des transcriptases inverses 
(concentration et temperature) sont bien connues de I'homme du metier. En 
30 particulier, on utilise generalement de 10 a 30 Unites d'enzyme par reaction, 
en presence d'une concentration optimale en Mg 2+ de 10 mM. 
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La ou les amorces utilisees pour la transcription inverse 
peuvent etre de natures differentes. II peut s'agir en particulier d'un 
oligonucleotide aleatoire ("random") comprenant de preference entre 4 et 10 
nucleotides, avantageusement un hexanucleotide. L'utilisation de ce type 
d'amorce aleatoire a ete decrite dans la litterature et permet d'initier la 
transcription inverse en differentes positions au hasard au sein des 
molecules d'ARN. Cette technique est surtout employee pour la transcription 
.nverse d'ARN totaux (c'est-a-dire comprenant les ARNm, les ARNt et les 
ARNr notamment). Dans le cas ou Ton souhaite rea.iser la transcription 
inverse des ARNm seulement, il est avantageux d'utiiiser comme amorce un 
oligonucleotide oligo dT, qui permet d'initier la transcription inverse a partir 
des queues polvA specifiques des ARN messagers. L'oligonucleotide oligo 
dT peut comprendre de 4 a 20-meres, avantageusement de 15-meres 
envron. L'emploi de ce type d'amorce constitue un mode de realisation 
prefere de ('invention. D'autre part, il peut etre avantageux d'utiiiser pour la 
transcription inverse une amorce marquee. Ceci peut en effet permettre de 
reconnaltre et/ou de selectionner et/ou de trier ulterieurement les ARN des 
ADNc. Ceci peut egalement permettre d'isoler les heteroduplex ARN/ADN 
dont la formation represente une etape clef de I'invention. Le marquage de 
I'amorce peut consister en tout systeme de type ligand-recepteur, c'est-a-dire 
permettant par affinite de separer les molecules portant .'amorce. II peut 
s'ag.r par exemple d'un marquage par la biotine, qui peut etre separe par tout 
support (bille, colonne, plaques, etc.) sur lequel est fixee la streptavidine 
Tout autre systeme de marquage permettant cette separation sans affecter 
les proprietes d'amorce peut etre utilise de maniere equivalents 

Dans les conditions habituelles de mise en oeuvre, cette 
transcription inverse genere des ADN complementaires (ADNc) simple-brins 
Cec, constitue un premier mode avantageux de la presente invention. 

Dans une deuxieme variante de mise en oeuvre, la transcription 
-nverse est realisee de maniere a preparer des ADNc double-brins. Pour ce 
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faire, apres transcription du premier brin d'ADNc, le deuxieme brin peut etre 
genere selon les techniques classiques de biologie moleculaire faisant 
intervenir des enzymes de modification de I'ADN comme I'ADN Ligase du 
phage T4, I'ADN polymerase I et I'ADN polymerase du phage T4. 
5 Les preparations d'ADNc peuvent etre utilisees 

extemporanement ou etre conservees, de preference au froid, en solution ou 
congelees, pour des utilisations ulterieures. 

Hybridations 

io Comme explique ci-avant, les methodes selon I'invention 

reposent en partie sur une etape originale d'hybridation croisee entre les 
ARN et les ADNc provenant d'echantillons biologiques dans des situations 
physiologiques ou d'origines differentes. Dans un mode de realisation 
prefere, ('hybridation selon 1'invention est avantageusement realisee en 

15 phase liquide. En outre, elle peut etre effectuee dans tout dispositif 
approprie, tel que par exemple des tubes (Eppendorff, par exemple), des 
plaques, ou tout autre support adapte et couramment utilise en Biologie 
Moleculaire. Uhybridation est avantageusement realisee dans des volumes 
compris entre 10 et 1000 par exemple entre 10 et 500 pi. II est entendu 

20 que le dispositif utilise et les volumes utilises peuvent etre aisement adaptes 
par rhomme du metier. Les quantites d'acides nucleiques utilisees pour 
Thybridation sont egalement connues de rhomme du metier. En general, il 
est suffisant dYitiliser des microgrammes d'acides nucleiques, par exemple 
de I'ordre de 0,1 a 100 pg. 

25 Un element plus important dans la mise en oeuvre des 

hybridations reside dans les quantites respectives d'acides nucleiques 
utilisees. Ainsi, il est possible d'utiliser les acides nucleiques dans un rapport 
ADNc/ARN variant de 50 a 0,02 environ, de preference de 40 a 0,1. De 
maniere plus particulierement avantageuse, on pr6fere que le rapport 

30 ADNc/ARN soit proche ou superieur a 1. En effet, dans ces experiences, 
TARN constitue le compose test ("tester") et I'ADNc constitue le porteur 
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("driver"). De ce fait, dans le but d'ameliorer la specified de la methode, il est 
preferable d'operer dans des conditions ou le "driver se trouve en exces par 
rapport au "tester". En effet, dans ces conditions. I'effet de cooperative entre 
les acides nucleiques joue et les appariements non-parfaits sont fortement 
5 defavorises. De ce fait, les seu.s mesappariements qui apparaissent sont 
generalement dus a la presence de regions dans les ARN "tester" qui 
n-existent pas dans I'ADNc "driver et qui sont done specifiques. Pour 
favonser la specified du precede, .'hybridation est done avantageusement 
reahsee a un rapport ADNc/ARN compris entre 1 environ et 10 environ II est 
' b,en 6ntendU qUe Ce ra PP° rt P eut *re adapte par I'homme du metier selon 
les conditions du precede (quantites d'acides nucleiques disponibles 
s,tuat,ons physio.ogiques, but poursuivi, etc.). Les autres parametres de 
I'hybndation (temps, temperature, force ionique) sont egalement adaptables 
par I'homme du metier. De maniere generale apres denaturation des "tester" 
et "driver (par chauffage par exemple), I'hybridation est realisee pendant 
env.ron 2 a 24 heures, a une temperature de 37'C environ (eventuel.ement 
soum.se a des sauts de temperature comme decrit plus .oin), et dans des 
cond,t,ons standard de force ionique (pouvant varier de 0,1 a 5M NaCI par 
exemple). I. est eonnu que la force ionique est un des facteurs determinant la 
stnngence d'une hybridation, notamment dans le cas d'hybridation sur 
support solide. 

Selon un mode de mise en oeuvre perticulier de I'invention 
('hybridation est realisee en emulsion phenolize, par exemple selon la 
teonnique PERT ("Phenol Emulsion DNA Reassociation Teohnique, deorite 
par Kohne D.E. et al. (Biochemistry, Vol. 16, N° 24, pp 5329-5341 1977, 
Avantageusement, on utilise dans le oadre de la presente invention 
I'hybndation en emulsion phenolize maintenue par thermooyoles (sauts de 
temperature de 37°C environ a 60/65'C environ, et non par agitation, selon 
la teohnique decrite par Miller et Riblet (NAR 23 (1995) 2339, Toute autre 
technique d'hybridation en phase liquide, notamment en emulsion, peut etre 
utiiisee dans ,e cadre de la presente invenfion. Ainsi, dans un autre mode 
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particulierement avantageux, rhybridation est realisee dans une solution 
contenant 80% de formamide, a une temperature de 40°c par exemple. 

L'hybridation peut egalement se faire avec I'un des partenaires 
immobilise sur un support. Avantageusement, c'est PADNc qui est 
5 immobilise. Cela peut etre realise en tirant profit du marquage dont peuvent 
faire I'objet les ADNc (voir ci-dessus) notamment grace a des amorces 
biotinylees. Les groupements biotine sont mis en presence de billes 
magnetiques sur lesquelles sont fixees des molecules de streptavidine. Les 
ADNc peuvent ensuite etre maintenus grace a un aimant au contact d'un 

10 filtre ou d'un puits de plaque de microtitration. Les ARN sont ensuite, dans 
les conditions de force ionique requise, mis en presence des ADNc. Les ARN 
non apparies sont elimines par lavage. Les ARN hybrides ainsi que les ADNc 
sont recuperes par retrait du champ magnetique. 

Dans le cas ou I'ADNc est double-brin, les conditions 

15 d'hybridation utilisees sont essentiellement similaires a celles decrites ci- 
dessus, et adaptables par I'hommei du metier. On prefere dans ce cas 
proceder a I'hybridation en presence de formamide et on expose les 
complexes a une gamme de temperatures allant par exemple de 60 a 40 °C, 
preferentiellement de 56 °C a 44 °C, afin de favoriser la formation de 

20 complexes de type R-loop. De plus, il est souhaitable d'ajouter, apres 
rhybridation, un agent de stabilisation des triplex formes, une fois la 
formamide retiree du milieu, tels queje glyoxal par exemple (Kaback et.al. 

(1 979) Nuc. Acid Res.,: 6, 2499-251 7). 

Ces hybridations croisees selon ('invention generent ainsi des 

25 compositions comprenant des heteroduplex ou heterotriplex ADNc/ARN, 
representant les qualites de chacune des situations physiologiques testees. 
Comme indique ci-avant, dans chacune de ces compositions, des acides 
nucleiques correspondant essentiellement a des epissages alternatifs 
differentiels ou a d'autres alterations genetiques, specifiques de chaque 

30 situation physiologique, peuvent etre identifies et/ou clones. 

L'invention concerne done avantageusement un procede 
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^identification et/ou de clonage de regions d'acides representatives de 
differences genetiques entre deux situations physiologiques, comprenant 
une etape d'hybridation entre les ARN provenant d'un echantillon biologique 
dans une premiere situation physiologique et les ADNc simple-brins 
provenant d'un echantillon biologique dans une deuxieme situation 
physiologique, et Identification et/ou le clonage, a partir des hybrides ainsi 
formes, des regions d'ARN non-appariees. 

Cette premiere variante repose plus particulierement sur la 
formation d'heteroduplex entre les ARN et les ADNc simple-brin (voir Figures 
2-4). Cette variante est avantageusement mise en oeuvre en utilisant des 
ARN messagers ou des ADNc produits par transcription inverse des ARN 
messagers essentiellement, c'est-a-dire en presence d'une amorce oligo dT. 

Dans un mode particulier de mise en oeuvre, le precede 
d'identification et/ou de clonage d'acides nucleiques de ('invention 
comprend : 

(a) ('hybridation d'ARN provenant de la situation test avec les 
ADNc simple-brin provenant de la situation de reference; 

(b) ('hybridation d'ARN provenant de la situation de reference 
avec les ADNc simple-brin provenant de la situation test; et 

(c) ('identification et/ou le clonage, a partir des hybrides formes 
en (a) et (b), de regions d'ARN non-appariees. 

Dans une variante particuliere de mise en oeuvre, le precede 
de I'invention comprend les etapes suivantes : 

(a) I'obtention d'ARN a partir d'un echantillon biologique dans 
une situation physiologique A (rA); 

(b) I'obtention d'ARN a partir d'un meme echantillon biologique 
dans une situation physiologique B (rB); 

(c) la preparation d'ADNc a partir d'une partie des ARN rA 
obtenus en (a) (ADN cA) et a partir d'une partie des ARN rB obtenus en (b) 
(ADN cB) au moyen d'amorces polyT, 

(d) ('hybridation en phase liquide d'une partie des ARN rA avec 
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une partie des ADN cB (pour generer des heteroduplex rA/cB) 

(e) I'hybridation en phase liquide d'une partie des ARN rB avec 
une partie des ADN cA (pour generer des heteroduplex rB/cA), 

(f) I'identification et/ou le clonage de regions d'ARN non 
5 appariees dans les heteroduplex rA/cB et rB/cA obtenus en (d) et en (e). 

Dans une autre variante particuliere de mise en oeuvre, le 
precede de I'invention comprend I'hybridation d'ARN provenant de la 
situation test avec les ADNc double-brins provenant de la situation de 
reference, et I'identification et/ou le clonage des regions d'ADN double-brin 

10 maintenues. Cette deuxieme variante repose plus particulierement sur la 
formation d'heterotriplex entre les ARN et les ADNc double-brin, derive des 
structures de type R-loop (voir Figure 5). Cette variante est egalement 
preferentiellement mise en oeuvre en utilisant des ARN messagers ou des 
ADNc produits par transcription inverse des ARN messagers 

15 essentiellement, c'est-a-dire en presence d'une amorce polyT. Dans cette 
variante egalement, un mode de realisation particulier comprend deux 
hybridations paralleles, generant deux populations d'acides nucleiques selon 
Tinvention. Dans cette variante, les regions recherchees, specifiques des 
epissages alternatifs, ne sont pas les regions d'ARN non appariees, mais 

20 des ADN double-brins qui n'ont pu etre deplaces par une sequence ARN 
homologue (voir Figure 5). 

Dans une autre variante de Tinvention, le procede comprend, 
pour isoler les differences genetiques qualitatives (e:g.; les differences 
d'epissage) qui existent entre deux echantillons, I'hybridation entre une 

25 population d'ADNc double-brin provenant d'un premier echantillon biologique 
et une population d'ADNc (double-brin ou, preferentiellement simple-brin) 
provenant d'un deuxieme echantillon biologique (figure 6). 

A la difference des variantes presentees precedemment, celle-ci 
n'utilise pas des heteroduplexes ou des heterotriplexes ADN/ARN mais des 

30 homoduplexes ADN/ADN. Cette variante est avantageuse puisqu'elle ne 
donne pas seulement acces aux exons et aux introns alternatifs mais 
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egalement, et a I'interieur d'une meme banque d'acides nucleiques, aux 
jonctions specifiques creees par deletion d'un exon ou d'un intron. De plus 
les sequences dans une telle banque donnent acces aux sequences 
flanquantes des exons et introns alternatifs. 
i Pour les deux echantillons (i.e., conditions physiopathologiques) 

etudies, les ARN cytosoliques polyA* sont extraits selon les techniques 
connues de I'homme de metier et decrites precedemment. Ceux-ci sont 
convertis en ADNc par Taction d'une transcriptase inverse depourvue ou non 
d'activite RNAse H intrinseque, comme decrit precedemment. L'un de ces 
ADNc simple brin est ensuite convert! en ADNc double-brin par amorcage a 
I'aide d'hexameres aleatoires et selon les techniques connues de I'homme 
de I'art. Pour I'une des situations etudiees nous disposons done d un ADNc 
simple-brin (appele "driver") et pour I'autre situation d'un ADNc double-brin 
(appele "tester"). Ces ADNc sont denatures par chauffage puis melanges de 
telle facon que le driver est en exces par rapport au tester. Cet exces est 
choisi entre 1 et 50 fois, avantageusement 10 fois. Dans une experience 
donnee. menee a partir de deux situations physiopathologiques, le choix de 
la situation qui donne le driver est arbitraire et ne doit pas influencer la nature 
des informations recueillies. En effet, comme dans le cas des approches 
precedemment presentees, la strategie d'identification des differences 
qualitatives qui existent entre deux populations d'ARNm repose sur le 
clonage de ces differences presentes dans des messagers communs : la 
strategie repose sur le clonage de sequences presentes au sein de duplex et 
non de simples brins correspondant a des sequences singulieres ou en 
exces dans I'une des situations etudiees. Le melange des populations 
d'ADNc est precipite puis repris dans une solution contenant du formamide 
(par exemple 80%). L'hybridation est menee de 16 heures a 48 heures 
avantageusement 24 heures. Les produits de cette hybridation sont 
precipites puis soumis a Taction d'une endonuclease de restriction ayant un 
site de reconnaissance de I'ADN double-brin dicte par 4 bases. Une telle 
enzyme de restriction va done diver I'ADNc double brin forme lors de 
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I'hybridation en moyenne toutes les 256 bases. Cette enzyme est 
selectionnee avantageusement pour generer des sites cohesifs. Des 
exemples de telles enzymes sont fournis par des enzymes de restriction 
telles Sau3AI, Hpall, Taql et Msel. Sont done accessibles a une strategie de 
5 clonage utilisant les sites de restriction dives les fragments double-brin 
digeres par ces enzymes. Ces fragments sont de deux types : des fragments 
parfaitement hybrides, dont les deux brins sont parfaitement 
complementaires, et des fragments dont I'hybridation est partielle e'est a dire 
comprenant une boucle simple brin encadree par des regions double-brin 

10 (Figure 6A). Ces derniers fragments, minoritaires, contiennent les 
informations d'interet. Afin de les separer des fragments parfaitement 
hybrides, majoritaires puisque derives de la majorite de ia longueur des 
ADNc, des techniques de separation sur gel ou sur toute autre matrice 
appropriee sont utilisees. Ces techniques mettent a profit le retard de 

is migration, electrophoretique ou lors de gel filtration notamment, des 
fragments d'ADN qui contiennent une boucle d'ADN simple-brin. Ainsi les 
populations de fragments minoritaires qui contiennent les informations 
desirees peuvent etre separees de fa?on preparative des populations de 
fragments majoritaires correspondant aux regions d'ADN identiques dans les 

20 deux populations. Cette variante, qui permet d'isoler au sein d'une meme 
population les empreintes positives et negatives liees a des differences 
qualitatives, peut egalement etre appliquee a des heteroduplexes ARN/ADN. 
A cet egard/ un- exemple de retard de migration d'un heteroduplexe 
ARN/ADN dans lequel une partie de I'ARN n'est pas appariee, par rapport a 

25 un heteroduplexe homologue dans lequel toutes les sequences sont 
appariees est illustre sur le modele grb2/grb33 decrit dans les exemples (voir 
notamment la figure 8, puits 2 et 3). 



30 



Identification et/ou Clonage 

A partir des populations d'acides nucleiques generees par 
hybridation, les regions caracteristiques des differences qualitatives (e.g., 
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des epissages. alternatifs differentiels) peuvent etre identifiees par toute 
technique connue de I'homme du metier. 



Identification et/ou clonage a partir des heteroduplexes 

i ARN/ADN 

Ainsi, dans le cas des heteroduplex ARN/ADN (premiere 
variante du precede), ces regions se presentent essentiellement sous forme 
de regions d'ARN non-appariees (boucles d'ARN), comme represent sur la 
Figure 3. Ces regions peuvent done etre identifiees et donees par separation 
des heteroduplexes, et des acides nucleiques simple-brin (ADN, ARN) 
(exces d'acide nucleique n'ayant pas reagi), digestion selective des ARN 
double-brins (domaines engages dans les heteroduplex), puis separation des 
ARN simple-brin resultant et des ADN simple-brins. 

A cet egard, selon une premiere approche illustree sur la Figure 
3, les regions d'ARN non appariees sont identifies par traitement des 
heteroduplex au moyen d'une enzyme capable de digerer selectivement les 
domaines des ARN engages dans des heteroduplex ARN/ADN. Des 
enzymes douees de cette propriete sont decrites dans Tart anterieur et sont 
disponibles dans le commerce. Ce sont les RNases H, telles que en 
particulier, celle de E. Coli produite sous forme recombinants et disponible 
dans le commerce (Promega Ref. M4281 ; Life Technologies Ref. 18021). 
Ce premier traitement genere done un melange comprenant les regions 
d'ARN non appariees simple-brin et les ADNc simple-brin. Les ARNs peuvent 
etre separes des ADNc par toute technique connue de I'homme du metier et 
notamment sur la base du marquage des amorces utilisees pour la 
preparation des ADNc (voir ci-dessus). Ces ARN peuvent etre utilises 
comme source de materiel pour Identification de cibles, de produits 
genetiques d'interet ou toute autre application. Ces ARN peuvent ega.ement 
etre convertis en ADNc, puis clones dans des vecteurs, comme decrit ci- 
apres. 

A cet egard, le clonage des ARNs peut etre realises de 
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differentes fa?ons. L'une consiste a inserer a chaque extremite des ARN des 
oligonucleotides servant de matrice a une reaction de transcription inverse 
en presence des amorces correspondantes. Cet ajout d'amorces se fait 
selon les techniques bien connues de I'homme du metier grace a une 
5 enzyme, telle que par exemple la ARN ligase qui provient du phage T4 et qui 
catalyse la formation de liaisons phosphodiester intermoleculaires entre le 
phosphate en 5* d'une molecule donneuse et I'hydroxyl en 3' d'une molecule 
acceptrice. Une telle ARN ligase est disponible commercialement (par 
exemple Life Technologies - GIBCO BRL Ref. 18003). Les ADNc ainsi 
10 obtenus peuvent ensuite etre amplifies par les techniques classiques (PCR 
par exemple) en utilisant les amorces appropriees, comme illustre sur la 
Figure 3. Cette technique est particulierement adaptee au clonage des ARN 
de petite taille (inferieure a 1000 b). 

Une autre approche pour le clonage et/ou identification des 
is regions d'ARN specifiques consiste par exemple a realiser une transcription 
inverse, sur le produit de digestion par une enzyme specifique des ARN 
engages dans des double-brins, telle la Rnase H, en utilisant des amorces 
aleatoires, qui vont initier la transcription au hasard a Tinterieur des ARNs. 
Les ADNc obtenus sont ensuite amplifies selon les techniques classiques de 
20 biologie moleculaire, par exemple par PCR en utilisant des amorces grace a 
des oligonucleotides ajoutes aux extremites des ADNc grace a Taction de 
TARN ligase du phage T4 (disponible commercialement ; par exemple chez 
Life Technologies - GIBCQ BRL ref. 18003). Cette seconde technique est 
illustree sur la Figure 4 et dans les exemples. Cette technique est plus 
25 particulierement adaptee aux ARNs de taille importante, et permet d'obtenir 
une partie de information de sequence, suffisante pour reconstituer par la 
suite la totalite de la sequence de depart. 

Une autre approche pour le clonage et /ou identification des 
regions d'ARN specifiques repose egalement sur la realisation d'une 
30 transcription inverse en utilisant des amorces aleatoires (figure 4). 
Neanmoins, selon cette variante, les amorces utilisees sont au moins en 
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partie des amorces semi-aleatoires, c'est-a-dire des oligonucleotides 
comprenant: 

une region aleatoire (de degenerescence), 

- une zone minimale d'amorcage presentant un degre de 
contrainte defini, et 

- une zone stabilisatrice. 

De preference, il s'agit d'oligonucleotides comprenant, dans 
I'orientation 5' ~>3' : 

- une zone stabilisatrice comprenant 8 a 24 nucleotides 
determines, de preference de 10 a 18 nucleotides. Cette zone stabilisatrice 
peut elle-meme correspondre a la sequence d'un oligonucleotide utilise pour 
reamplifier les fragments issus des premieres amplifications realisees a I'aide 
des amorces semialeatoires de ('invention. En outre, la zone stabilisatrice 
peut comprendre la sequence d'un ou plusieurs sites, de preference non- 
15 palindromiques, correspondant a des enzymes de restriction. Ceci permet 

par exemple de faciliter le clonage des fragments ainsi amplifies. Un 
exemple particulier de zone stabilisatrice est represents par la sequence 
GAG AAG CGT TAT (residus 1 a 12 de SEQ ID NO:1); 

- une region aleatoire ayant de 3 a 8 nucleotides, plus 
20 particulierement de 5 a 7 nucleotides, et 

- une zone minimale d'amorcage definie de sorte que 
('oligonucleotide s'hybride en moyenne au moins toutes les 60 pb environ de 
preference toutes les 250 pb environ. Plus preferentie.lement, la zone 
d'amorcage comporte de 2 a 4 nucleotides definis, preferentiellement 3 ou 4 

15 tels que par exemple AGGX, ou X represente I'une des quatre bases A C G 
ou T. La presence d'une telle zone d'amorcage confere a I'oligonucleotide la 
capacte d'hybrider en moyenne toutes les 256 paires de bases environ. 

De maniere particulierement preferee, il s'agit 
d'oligonucleotides de formule : 

° GAGAAGCGTTATNNNNNNNAGGX (SEQ ID NO- 1) ou les 

bases fixees ont ete ordonnees de fa 5 on a minimiser le bruit de fond du a 
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des autoappariements dans des experiences de PCR, ou N indique que les 
quatre bases peuvent etre presentes de fagon aleatoire a la position 
indiquee, et ou X represente Tune des bases A, C, G ou T. De tels 
oligonucleotides constituent egalement un objet de la presente invention. 

A cet egard, de fagon a augmenter les possibilites d'amorgage 
sur les ARN a doner, des reactions en parallele peuvent etre effectuees 
avec des oligonucleotides tels que : 

GAGAAGCGTTATNNNNNNNAGGT (oligonucleotides A) 
GAGAAGCGTTATNNNNNNNAGGA (oligonucleotides B) 

GAGAAGCGTTATNNNNNNNAGGC (oligonucleotides C) 
GAGAAGCGTTATNNNNNNNAGGG (oligonucleotides D), 
chaque population d'oligonucleotides (A, B, C, D) pouvant etre utilisee 
individuellement ou en combinaison avec une autre. 

Apres I'etape de transcription inverse, les ADNc sont amplifies 
par PCR en utilisant les oligonucleotides A ou B ou C ou D. 

Comme indique ci-avant, selon la complexity et la specificite de 
la population des oligonucleotides souhaitee le nombre de positions 
degenerees peut varier de 3 a 8, de preference de 5 a 7. En dega de 3 les 
hybridations sont restreintes et au dela de 8 la population d'oligonucleotides 
est trop complexe pour assurer une bonne amplification de bandes 
specifiques. 

Par ailleurs, la longueur de I'extremite 3' fixe (la zone 
d'amorgage contrainte) de ces— oligonucleotides peut egalement etre 
modifiee : si les amorces decrites plus haut, avec 4 bases fixees, permettent 
d'amplifier en moyenne des fragments de 256 paires de bases, des amorces 
avec 3 bases fixes permettent d'amplifier des fragments plus courts (64 
paires de bases en moyenne). Dans un premier mode prefer^ de I'invention, 
on utilise des oligonucleotides dans lesquels la zone d'amorgage comprend 4 
bases fixes. Dans un autre mode prefere de Hnvention, on utilise des 
oligonucleotides ayant une zone d'amorgage de trois bases fixes. En effet, 
les exons ayant une taille moyenne de 137 bases, ceux-ci sont 
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avantageusement amplifies avec de tels oligonucleotides. A cet egard, voir 
egalement les oligonucleotides de sequence SEQ ID NO: 2, 3 et 4, par 
exemple. 

Enfin, generalement, I'etape d'identification et/ou de clonage 
5 des ARN met en oeuvre les differentes methodes de PCR et de clonage, de 
maniere a obtenir rinformation la plus complete. 

. Identification et/ou clonage a partirdes heterotriplexes. 
Dans le cas des heterotriplexes (autre variante du procede), les 
regions de differences qualitatives (insertions, deletions, epissages 
d.fferentieis) se presentent essentiellement sous forme de regions d'ADN 
double-brin, comme represent sur la Figure 5. Ces regions peuvent done 
etre identifiees et donees par traitement en presence d'enzymes appropriees 
telles qu'une enzyme permettant de digerer les ARN, puis une enzyme 
permettant de digerer les ADN simpl ; e-brin. Les acides nucleiques ainsi 
obtenus sont done directement sous forme d'ADN double-brin et peuvent 
etre clones dans tout vecteur appYoprie, tel le vecteur pMos-Blue 
(Amersham, RPN 51 10), par exemple. Cette methodo.ogie est a differencier 
des approehes deja decrites utilisant des ARNs ou oligonucleotides de 
sequences predetermines, modifies pour exercer une activite nucleasique 
(Landgraf et al. (1994) Biochemistry, 33, 10607-10615). 

• Identification et/ou clonage a partir des homoduplexes 
ADN/ADN (figure 6). 

Les fragments isoles par leurs structures atypiques sont ensuite 
add rt ,onnes, a chacune de .eurs extremites, d'adaptateurs, ou linkers, ayant 
des S ,tes de restriction dives a fune de leurs extremites. Cette etape peut 
etre realisee selon les techniques connues de I'homme du metier par 
exemple par ligation avec I'ADN ligase du phage T4. Les sites de restriction 
a,nsi introduits sont choisis compatibles avec les sites des fragments 
d'ADNc. Les linkers introduits sont des sequences d'ADNc double-brin de 
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sequences connues, permettant de deriver des amorces pour realiser des 
amplifications enzymatiques (PCR). Puisque I'etape suivante consiste a 
amplifier les deux brins qui presentent entre eux les differences qualitatives a 
identifier, il est necessaire d'utiliser des linkers dont les extremites 5' sont 
5 phosphorylees. Ainsi apres denaturation thermique des ADNc double-brin 
additionnes de linkers, chacune des extremites de ces ADNc est liee de 
fagon covafente avec une sequence d'amorgage specifique. Apres PCR a 
I'aide des amorces specifiques appropriees, deux categories d'ADNc double- 
brin sont obtenues: des fragments qui contiennent des sequences 

10 specifiques de differences qualitatives qui distinguent les deux situations 
physiopathologiques, et des fragments qui comprennent I'empreinte negative 
de ces evenements d'epissages. Le clonage de ces fragments permet 
d'obtenir une banque d'epissages alternatifs dans laqueile, pour chaque 
evenement d'epissage, des empreintes positives et negatives sont 

is presentes. Dans cette banque, sont done accessibles non seulement les 
exons et les introns alternatifs mais aussi les jonctions specifiques creees 
par excision de ces sequences epissees. Dans une meme banque, ces 
differentes informations genetiques peuvent provenir des deux situations 
physiopathologiques sans discrimination. Par ailleurs, de fagon a verifier le 

20 caractere differentiel des epissages identifies et de fagon a determiner dans 
quelle situation ceux-ci sont specifiquement recrutes, les clones de la banque 
peuvent etre hybrides avec des sondes derivees de chacune des populations 
totalesdesARNm. 

25 Deux usages principaux peuvent etre envisages pour les 

fragments d'ADNc issus des differences qualitatives identifies : 

- Leur clonage dans des vecteurs appropries de fagon d 
constituer des banques representatives des differences qualitatives qui 
existent entre les deux situations physiopathologiques etudiees, 

3 o - Leur utilisation en tant que sondes afin de cribler une banque 

d'ADN permettant d'identifier les evenements episses de fagon differentielle. 
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Les vecteurs utilises dans Invention peuvent etre notamment des 
plasmides, cosmides, phages, YAC, HAC, etc. Ces acides nucleiques 
peuvent ainsi etre conserves tels quels ou introduits dans des 
microorganismes adaptes au vecteur de clonage utilise, afin d'etre multiplies 
5 et/ou conserves sous forme de cultures. 

Les methodes telles que decrites ci-dessus sont generalement 
mises en oeuvre, pour chaque echantillon, sur une periode de temps de 
moins de deux mois, en particulier moins de 6 semaines. Par ailleurs, ces 
differentes methodes peuvent etre automatisees afin de reduire la duree 
io totale et de faciiiter le traitement de nombreux echantillons. 

A cet egard, un autre objet de ('invention concerne les acides 
nucleiques identifies et/ou clones par les methodes de (Invention. Comme 
indique ci-dessus, ces acides nucleiques peuvent etre des ARN ou des 
ADNc. Plus generalement, Invention concerne une composition d'acides 
is nucleiques, comprenant essentiellement des acides nucleiques 
correspondant aux epissages alternatifs distinguant deux situations 
physiologiques. Plus particulierement, ces acides nucleiques correspondent 
aux epissages alternatifs identifies dans un echantillon biologique test et non 
presents dans le meme echantillon biologique dans une situation de 
reference. L'invention a egalement pour objet ('utilisation des acides 
nucleiques ainsi clones comme produit therapeutique ou diagnostic, ou 
comme outil de criblage de molecules actives, comme indique ci-apres. 

Les differentes methodes exposees ci-dessus aboutissent done 
toutes au clonage de sequences d'ADNc qui representent I'information 
25 genetique epissee differentiellement entre deux situations 
physiopathologiques. Uensemble des clones issus de I'une de ces methodes 
permet done la constitution d'une banque representative des differences 
qualitatives qui existent entre deux situations etudiees. 
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Generation de hang up qualitative 

A cet egard, ('invention concerne en outre un procede de 
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preparation d'une banque d'acides nucleiques representatifs d'un etat 
physiologique donne d'un echantillon biologique. Ce precede comprend 
avantageusement le clonage decides nucleiques representatifs des 
marqueurs qualitatifs depression genetiques (par exemple des epissages 
5 alternatifs) dudit etat physiologique et non presents dans un etat de 
reference, dans des banques specifiques de differences qualitatives qui 
existent entre les 2 etats etudies. 

Ces banques sont constitutes d'ADNc inseres dans des 
vecteurs plasmidiques ou phagiques. Ces banques peuvent etre presentees 
10 sur des filtres de nitrocellulose ou tout autre support connu de Phomme de 
Part, tels des chips ou biopuces. 

L'une des caracteristiques et en meme temps I'une des 
originates du criblage differentiel qualitatif est que cette technique aboutit a 
non pas une mais avantageusement deux banques differentielles qui 
is represented Pensemble des differences qualitatives qui existent entre deux 
situations donnees : Paire de banque (voir figure 1 D). 

Ainsi, Invention concerne de preference toute composition ou 
banque d'acides nucleiques, susceptible d'etre obtenue par hybridation entre 
une population d'ARN provenant d'un premier echantillon biologique et une 
20 population d'ADNc provenant d'un deuxieme echantillon biologique. Plus 
preferentiellement, les banques ou compositions de Pinvention comprennent 
des acides nucleiques representatifs des differences qualitatives 
d'expression entre deux echantillons biologiques, et sont prod uites par un 
procede comprenant (i) une etape au moins d'hybridation entre une 
25 population d'ARN provenant d'un premier echantillon biologique et une 
population d'ADNc provenant d'un deuxieme echantillon biologique, (ii) la 
selection des acides nucleiques representatifs des differences qualitatives 
d'expression et, eventuellement (iii) le clonage desdits acides nucleiques. 

En outre, apres constitution de telles banques, il est possible 
30 d'effectuer une etape de selection des clones pour ameliorer la specificite 
des banques obtenues. En effet, il est possible que certains 
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mesappariements observes ne soient pas uniquement dus a differences 
qualitatives (e.g. a des epissages alternatifs differentiels), mais puissent 
resulter de defaut(s) de la transcription inverse par exemple. Bien que ces 
evenements ne soient pas generalement significatifs, il est preferable de les 
eliminer ou de les reduire prealablement au clonage des acides nucleiques. 
Pour ce faire, les clones de la banque peuvent etre hybrides avec les 
populations d'ADNc des deux situations physiologiques etudiees (voir etape 
(c) ci-dessus). Les clones hybridant de facon non differentielle avec les deux 
populations peuvent etre considers comme non-specifiques et 
eventuellement elimines ou traites en deuxieme priorite (en effet, ('apparition 
d'une nouvelle isoforme dans I'echantillon test ne signif.e pas toujours que 
Tisoforme initiale presente dans I'ecbantillon de reference a disparu de cet 
echantillon test). Les clones n'hybridant qu'avec une seule des deux 
populations ou hybridant de facon preference avec rune des populations 
sont considers comme specifiques et peuvent etre selectionnes en premiere 
priorite pour constituer des banques enrichies ou affinees. 

Un affinage peut egalement etre realise par hybridation et 
validation de clones avec des sondes provenant d'un nombre statistiquement 
relevant d'echantillons pathologiques. 

La presente demande a done egalement pour objet toute 
banque d'acides nucleiques comprenant des acides nucleiques specifiques 
d'epissages alternatifs caracteristiques d'une situation physiologique. Ces 
banques sont avantageusement constitutes d'ADNc, generalement double 
brin, correspondant aux regions d'ARN specifiques d'un epissage alternatif. 
Ces banques peuvent etre constitutes des acides nucleiques, generalement 
dans un vecteur de clonage ou de cultures cellulaires contenant lesdits 
acides nucleiques. 

Le choix des ARN de depart determine en partie les 
caracteristiques des banques obtenues : 

- les ARN des deux situations A et B sont des ARNm ou des 
ARN totaux matures isoles selon les techniques connues de I'homme de fart. 
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Les banques sont alors des banques de criblage differentiel qualitatif dites 
restreintes, car restreintes aux differences qualitatives qui caracterisent les 
ARN matures des deux situations physiopathologiques. 

- Les ARN de Tune des situations sont des ARNm ou totaux 
5 matures alors que les ARN de I'autre situation sont des ARN premessagers, 
non matures par epissage, isoles selon les techniques connues de Thomme 
de Tart, a partir de noyaux cellulaires. Dans ce cas les banques obtenues 
sont des banques de criblage differentiel dites complexes, puisque non 
restreintes aux differences entre ARN matures mais comprenant tout le 

10 repertoire des epissages transcrits dans une situation et elimines dans 
I'autre, dont tous les introns. 

enfrn, les ARN peuvent provenir d'une seule situation 
physiopathologique et dans ce cas le criblage differentiel implique les ARN 
matures et les premessagers d'un meme echantillon. Dans ce cas, les 

is banques obtenues sont des banques de criblage differentiel qualitatif 
autologues. L'interet de telles banques est qu'elles rassemblent 
exclusivement le repertoire des ihtronS' transcrits dans une situation donn6e. 
Leur hybridation avec une sonde provenant d'ARN matures d'une autre 
situation determine rapidement si a cette situation est caracterisee par une 

20 retention d'introns tout en permettant aisement leur identification. 

Generalement, les banques sont generees par etalement, sur 
milieu solide (notamment sur milieu gelose), d'une culture cellulaire 
. transformee par les acides.nucleiques clones. La transformation est realisee 
par toute technique connue de Phomme du metier (transfection, phosphate 

25 de calcium, electroporation, infection par des bacteriophages, etc). La culture 
cellulaire est generalement une culture de bacteries, telles que par exemple 
les bacteries E. coli. II peut egalement s'agir de cultures de cellules 
eucaryotes, notamment de cellules eucaryotes inferieures (levures par 
exemple). Cet etalement peut etre realise sur boite ou sur tout autre support 

30 adapte, en conditions steriles. En outre, ces cultures etalees en milieu gelose 
peuvent etre stockees sous forme congelee par exemple (dans du glycerol 
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ou autre agent adapte). Ces banques peuvent naturellement etre utilisees 
pour la production de "repiiques", c'est-a-dire de copies selon les techniques 
habituelles detaillees ci-apres. En outre, ces banques servent generalement 
a preparer une banque amplifiee, c'est-a-dire une banque comprenant 
chaque clone sous forme amplifiee. Une banque amplifiee est preparee 
comme suit : a partir de la culture etalee, tous les clones cellulaires sont 
recuperes et sont conditionnes pour etre conserves sous forme congelee ou 
au froid, dans tout milieu adapte. Cette banque amplifiee est 
avantageusement realisee a partir de cultures de bacteries E.coli, et 
conservee a 4°C, en conditions steriles. Cette banque amplifiee permet la 
preparation et la reproduction illimitee de toute banque ulterieure contenant 
ces clones, sur differents supports, pour differentes applications. Une telle 
banque permet en outre I'isolement et la caracterisation de tout clone 
d'interet. Chacun des clones constituant les banques de ('invention est en 
effet un element caracteristique d'une situation physiologique, et constitue 
done une cible particulierement interessante pour differentes etudes telles 
que la recherche de marqueurs, la preparation d;anticorps, le diagnostic, le 
traitement pour transfert de genes, etc. Ces differentes applications sont 
discutees plus en detail plus loin. La banque est generalement preparee 
comme decrit ci-dessus par etalement des cultures dans un milieu gelose, 
sur un support adapte (boite de petri par exemple). L'interet d'utiliser un 
milieu gelose est que chaque colonie peut etre separee et individualisee. A 
partir de cette culture, des repiiques a I'identique peuvent etre preparees en 
quantites importantes par simple "replique" sur tout support approprie selon 
les techniques de I'homme de I'art. Ainsi, la replique peut etre realisee au 
moyen de filtres, membranes (nylon, nitrocellulose, etc) permettant 
I'accrochage des cultures. Les filtres peuvent ensuite etre stockes en I'etat, a 
4X par exemple, sous forme dessechee, dans tout type de conditionnement 
qui n'altere pas les acides nucleiques. Les filtres peuvent egalement etre 
traites de maniere a eliminer les cellules, proteines, etc, et a ne conserver 
que des composants tels que les acides nucleiques. Ces traitement peuvent 
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comprendre notamment des proteases, des detergents, etc. Les filtres traites 
peuvent egalement etre conserves . dans tout dispositif ou toute condition 
adaptes aux acides nucieiques. 

Les banques d'acides nucieiques peuvent egalement etre 
5 preparees directement a partir des acides nucieiques, par depot sur des 
biopuces ou tout autre dispositif approprie. 

L'invention concerne egalement toute banque comprenant des 
oligonucleotides specifiques d'epissages alternatifs distinguant deux 
situations physiologiques. II s'agit avantageusement d'oligonucieotides 

10 simple-brin, comprenant de 5 a 100-meres, de preference moins de 50- 
meres, par exemple autour de 25-meres environ. 

Ces oligonucleotides sont specifiques d'epissages alternatifs 
representatifs d'une situation ou d'un type de situation physiologique. Ainsi, 
de tels oligonucleotides peuvent etre par exemple des oligonucleotides 

is representatifs d'evenements d'epissages alternatifs caracteristiques de 
situations d'apoptose. II a en effet ete decrit dans la litterature que certains 
epissages alternatifs etaient observes dans le cadre de situations 
apoptotiques. II s'agit par exemple d'epissages dans les genes Bclx, Bax, 
Fas ou Grb2 notamment. A partir des donnees publiees et des sequences 

20 accessibles dans la litterature et/ou sur bases de donnees, il est possible de 
creer des oligonucleotides specifiques des formes epissees et non epissees. 
Ces oligonucleotides peuvent par exemple etre crees selon la strategie 
suivante : 

(a) identification d'une proteine ou d'un evenement d'epissage 
25 caracteristique d'une situation d'apoptose et de la sequence du dorriaine 

episse. Cette identification peut etre basee sur des donnees publiees ou par 
compilation de sequences accessibles sur bases de donnees; 

(b) synthese artificielle d'un ou plusieurs oligonucleotides 
correspondent a une ou plusieurs regions de ce domaine, qui permettent 

30 done par hybridation de mettre en evidence la forme non 6pissee dans les 
ARN d'un echantillon test; 
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(c) synthese artificielle d'un ou plusieurs oligonucleotides 
correspondant a la region de jonction entre les deux domaines separes par 
le domaine episse. Ces oligonucleotides permettent done par hybridation de 
mettre en evidence la forme epissee dans les ARN d'un echantillon test; 

(d) reproduction des etapes (a) a (c) ci-dessus avec d'autres 
proteines ou evenements d'epissages caracteristiques d'une situation 
d'apoptose; 

(e) transfert sur un premier support approprie du ou des 
oligonucleotides specifiques des formes apoptotiques des messagers 
identifies ci-avant et, sur un autre support approprie, du ou des 
oligonucleotides specifiques des formes non-apoptotiques. 

Les deux supports ainsi obtenus peuvent §tre utilises pour 
tester I'etat physiologique de cellules ou echantiilons tests, et notamment leur 
etat apoptotique, par hybridation d'une preparation d'acides nucleiques de 
15 ces cellules ou echantiilons. 

D'autres banques similaires peuvent etre generees avec des 
oligonucleotides specifiques d'etats physiopathologiques differents 
(neurodegenerescence, toxicite, proliferation, etc.) et ainsi permettre un 
elargissement des domaines d'applications. 

Des banques d'introns ou d'exons altematifs peuvent aussi etre 
des banques de donnees informatiques constitutes par analyse 
systematique des banques de donnees qui regroupent les informations 
relatives au genome de tel ou tel organisme, tissu ou culture cellulaire. Dans 
ce cas, les donnees obtenues par constitution de telles banques virtuelles 
peuvent §tre utilisees pour generer des amorces oligonucleotidiques qui 
seront utilisees pour tester en parallele deux situations physiopathologiques. 

Les donnees des banques informatiques peuvent egalement 
etre utilisees pour deriver des sondes nucleotidiques generates, 
representatives d'une classe de proteines ou encore specifiques d'une 
sequence definie. Ces sondes peuvent ensuite etre appliquees sur les 
banques de clones issues des differentes techniques de clonage des introns 
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et exons alternatifs afin d'obtenir une image de la complexity de ces banques 
moleculaires et de determiner rapidement si telle ou telle classe de proteines 
ou telle ou telle sequence determinee est epissee differentiellement entre 
deux etats physiopathologiques distincts. 
5 Une autre banque ou compositions d'acides nucleiques selon 

I'invention est une banque antisens, realisee a partir des sequences 
identifies selon les methodes de I'invention (DATAS). Pour la realisation de 
ce type de banques, ces sequences sont donees de fa?on a etre exprimees 
en fragments d'ARN correspondant a une orientation antisens par rapport 

10 aux ARN messagers sur lesquels ont ete realises DATAS. On aboutit ainsi a 
une banque dite antisens. Cette approche utilise de preference la variante de 
clonage qui permet une orientation des fragments clones. L'interet d'une telle 
banque antisens est de permettre la transfection de lignees cellulaires et de 
suivre Alteration de tout phenotype qu'il soit d'ordre morphologique, 

is enzymatique ou suivi par ('utilisation de genes rapporteurs ou de resistance a 
un agent de selection. L'analyse des variations phenotypiques consecutives 
a Introduction d'un vecteur d'expression antisens se fait generalement apres 
selection de clones dits stables, c'est a dire permettant une replication 
coordonnee du vecteur d'expression et du genome de I'hote. Cette 

20 coordination est permise par Integration du vecteur depression dans le 
genome cellulaire ou, lorsque le vecteur d'expression est episomal, par 
pression de selection. Cette pression de selection se fait par traitement de la 
culture cellulaire transfectee avec un agent toxique qui ne peut etre detoxifie 
que lorsque le produit d'un gene porte par le vecteur d'expression est 

25 exprime dans la cellule. II s'ensuit une synchronisation entre la replication de 
I'hote et celle du transgene. Avantageusement, on utilise des vecteurs 
episomaux derives du virus Epstein-Barr qui permettent Texpression dans 
une meme cellule de 50 a 100 copies du vecteur (Deiss et al, 1996, EMBO 
J., 15, 3861-3870 ; Kissil et al, 1995, J. Biol. Chem, 270, 27932-27936). 

30 L'interet de ces banques antisens alliees aux sequences 

DATAS qu'elles contiennent est d'identifier non seulement quel gene a eu 
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son expression inhibee pour amener au phenotype selectionne mais aussi 
d'identifier quelle isoforme d'epissage de ce gene a ete affectee. Lorsque le 
fragment antisens cible un exon donne, il peut en etre deduit que le domaine 
proteique et done la fonction impliquant ce domaine s'oppose au phenotype 
5 observe. En cela le couplage de DATAS avec une approche antisens 
represente un raccourci vers la genomique fonctionnelle. 

Puces a ADN 

L'invention concerne egalement tout support (membrane, filtre, 
10 biopuce, chip, etc) comprenant une banque ou une composition d'acides 
nucleiques telle que definie ci-dessus. II peut s'agir plus particulierement 
d'une banque cellulaire ou d'une banque d'acides nucleiques. L'invention 
concerne egalement tout kit ou support comprenant plusieurs banques selon 
l'invention. En particulier, il peut etre avantageux d'utiliser en parallele une 
is banque representative des qualites d'un etat physiologique test par rapport a 
un etat physiologique de reference et, a titre de controle, une banque 
representative des qualites de I'etat physiologique de reference par rapport a 
I'etat physiologique test ("paire de banques"). Un kit avantageux selon 
l'invention comprend done deux banques qualitatives differentielles de deux 
20 situations physiologiques (une "paire de banques"). Selon un mode de 
realisation particulier, les kits de l'invention comprennent plusieurs paires de 
banques telles que definies ci-dessus, correspondant a differents etats 
physiologiques ou a differents echantillons biologiques par exemple. Les kits 
peuvent comprendre par exemple ces differentes paires de banques 
25 deposees en serie sur un meme support. 

Generation rift sopd^ 

Une autre utilisation des compositions d'ADNc selon l'invention, 
representatifs des differences qualitatives qui existent entre deux etats 
30 physiopathologiques, consiste a en deriver des sondes. De telles sondes 
peuvent en effet etre utilisees pour cribler les evenements episses de fa?on 



BNSDOCID: <WO 9946403A1 J_> 



WO 99/46403 PCT/FR99/00547 

• «• • 

33 

differentielle entre deux situations physiopathologiques. 

Ces sondes (voir figure 1D) peuvent etre preparees par marquage des 
populations ou banques d'acides nucleiques selon les techniques 
classiques, connues de I'homme du metier. Ainsi, il peut s'agir de marquage 
5 enzymatique, radioactif, fluorescent, immunologique, etc. Preferentiellement, 
il s'agit d'un marquage radioactif ou fluorescent. Ce type de marquage peut 
etre realise par exemple en introduisant sur la population d'acides 
nucleiques (soit apres synthese soit au cours de leur synthese) des 
nucleotides marques, permettant leur revelation par les methodes 

i o conventionnelles. 

Une application est done de cribler une banque genomique 
classique. Une telle banque peut comprendre selon le vecteur, derive d'un 
phage ou d'un cosmide, des fragments d'ADN de 10kb a 40kb. Le nombre 
de clones hybridant avec les sondes generees par DATAS et representatifs 

15 des differences d'epissage qui existent entre deux situations reflete done a 
peu pres le nombre de genes affectes par des variations d'epissage, selon 
qu'ils sont exprimes dans Tune ou I'autre des situations etudiees. 

De preference, les sondes de I'invention sont utilisees pour 
cribler une banque d'ADN genomique (generalement humaine) adaptee a 

20 ('identification d'evenements d'epissage. De preference, une telle banque 
genomique est composee de fragments d'ADN de taille restreinte 
(generalement clones dans des vecteurs), de fagon a statistiquement ne 
recouvrir qu'un seul element epissable differentiellement, e'est a dire un seul 
exon ou un seul intron. La banque d'ADN genomique est done preparee par 

25 digestion d'ADN genomique avec une enzyme ayant un site de 
reconnaissance restreint par 4 bases, assurant ainsi la possibility d'obtenir 
par digestion menagee des fragments d'ADN de taille moyenne de 1kb. De 
tels fragments necessitent I'obtention de 10 7 clones pour constituer une 
banque d'ADN representative d'un genome d'organisme eucaryote 

30 superieur. Une telle banque constitue egalement un objet de la presente 
demande. Cette banque est ensuite hybridee avec les sondes derivees du 
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criblage differentiel qualitatif. Precisement, de chaque experimentation 
considered et qui compare deux situations physiopathologiques A et B, deux 
sondes (paire de sondes) sont obtenues. Une sonde enrichie en 
evenements d'epissages caracteristiques de la situation A et une sonde 
5 enrichie en marqueurs d'epissage de B. Les clones de la banque genomique 
qui hybrident preferentiellement avec Tune ou I'autre sonde portent des 
sequences preferentiellement epissees dans les situations 
physiopathologiques correspondantes. 

Les methodes de I'invention permettent ainsi I'identification 
io systematique de differences qualitatives depression genique. Ces 
methodes presentent de nombreuses applications, dans I'identification et/ou 
le clonage de molecules d'interet, en toxicologie, en pharmacologie ou 
encore en pharmacogenomique par exemple. 

15 Applications 

L'invention concerne done egalement ('utilisation des methodes, 
acides nucleiques ou banques decrite ci-dessus pour I'identification de 
molecules d'interet therapeutique ou diagnostique. L'invention concerne plus 
particulierement ('utilisation des methodes, acides nucleiques ou banques 

io decrite ci-dessus pour ('identification de proteines ou domaines proteiques 
affectes dans une pathologie. 

L'un des atouts de ces techniques est en effet d'identifier a 
I'interieur d'un messager, et par consequent de la proteine correspondante, 
les domaines fonctionnels qui sont affectes dans une pathologie donnee. 

5 Cela permet d'assigner a un domaine donne une importance dans le 
developpement ou le maintien d'un etat pathologique. L'avantage immediat 
de restreindre a un domaine precis d'une proteine I'impact d'une deregulation 
pathologique est de proposer celui-ci comme une cible relevante pour un 
criblage de petites molecules a visee therapeutique. Ces. informations 

) constituent egalement des clefs qui permettent de concevoir des 
polypeptides a activite therapeutique delivrables par therapie genique; Ces 
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polypeptides peuvent notamment etre des anticorps simples chaTnes derives 
d'anticorps neutralisants diriges contre les domaines identifies par les 
techniques d6crites ci avant. 

Plus specifiquement, les methodes selon I'invention permettent 
d'obtenirdes molecules qui peuvent: 

- etre des sequences codantes qui derivent d'exons alternatifs. 

- correspond re a des sequences non codantes portees par des 
introns episses differentiellement d'un etat physiopathologique a un autre. 

De ces deux points, differents enseignements peuvent etre 

tires. 

Les epissages alternatifs d'exons qui differencient deux etats 
physiopathologiques traduisent un niveau de regulation de I'expression 
genetique qui permet de moduler ( plus precisement d'abolir ou d'instaurer) 
une ou plusieurs fonctions d*une proteine donnee. Ainsi la plupart des 
domaines structuraux et fonctionnels (SH2, SH3, PTB, PDZ, et les domaines 
catalytiques de differentes enzymes...) etant codes par plusieurs exons 
contigus, deux configurations peuvent se presenter : 

i) Les domaines sont tronques dans la situation 
pathologique (Zhu, Q. et al, 1994, J. Exp. Med., vol 180, n°2, pp461-470); 
cela indique que les chemins de signalisation impliquant ces domaines 
doivent etre restaures dans un but therapeutique. 

ii) Les domaines sont maintenus au cours d'une 
pathologie alors qu'ils sont absents dans une situation saine; ces domaines 
peuvent etre consideres comme des cibles de criblage de petites molecules 
chimiques destinees a antagoniser les signaux transduits par l'interm§diaire 
de ces domaines. 

Les sequences epissees differentiellement peuvent 
correspondre a des regions non-codantes situees en 5' ou en 3 f de la 
sequence codante ou a des introns intervenant entre deux exons codants. 
Dans les regions non codantes, ces epissages differentiels peuvent traduire 
une modification de la stabilite ou de la traductibilite du messager (Bloom, T. 
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J., and Beavo. J. A., 1995, Proc. Natl. Acad. Sci. USA, vol93, n* 24, pp 
14188-14192; Ambartsumian, N. et al., 1995, Gene, vol 159, n° 1, pp 125- 
130). Ces phenomenes doivent alors etre recherches sur la base de ces 
informations et peuvent mettre en evidence que ("accumulation ou la 
5 disparity de la proteine correspondante la designe ainsi comme cible 
d'interet. Lorsque la retention d'un intron se produit dans une sequence 
codante, il s'ensuit le plus souvent une troncature de la proteine naturelle par 
introduction de codon stop dans la phase de lecture (Varesco, L, et al, 1994, 
Hum. Genet., vol 93, n°3, pp281-286; Canton, H., et al., 1996, Mol' 
io Pharmacol., vol 50, n" 4, PP 799-807, Ion, A, et al, 1996, Am. J. Hum 
Genet., vol 58, n°6, PP 1 185-1 191). Avant de rencontrer ce codon stop, il se 
produit generalement une lecture de quelques codons supplemental, ce 
qu, aboutit a adjoindre a la partie deja traduite une sequence specifique 
temoin proteique de I'epissage alternatif. Ces acides amines 
is supplemental peuvent etre utilises pour generer des anticorps specifiques 
de la forme alternative caracteristique de la situation pathologique. Ces 
anticorps peuvent etre ensuite utilises comme outils de diagnostic La 
proteine tronquee voit ses propriety modifiees, voire alterees. Ainsi des 
enzymes peuvent etre amputees de leur domaine catalytique ou de leur 
20 domaine regulateur, devenant inactives ou constitutivement activees Des 
adaptateurs peuvent perdre leur capacite a connecter differents partenaires 
d 'une cascade de signalisation(Watanabe, K. et al, 1995, J. Biol Chem vol 
270, n°23, PP 1 3733-1 3739). Les produits d'epissage des receptees peuvent 
aboufr a des recepteurs qui ont perdu leur capacite a lier leur ligand 
25 (Nakajima, T. et al, 1996, Life Sci., vol 58, n»9, pp761-768) et peuvent 
egalement generer des formes de recepteurs solubles par relargage de leur 
domaine extracellu.aire (Cheng J., 1994. Science, vo!263, n° 5154, pp1759- 
1762). Dans ce cas, des tests diagnostiques peuvent etre envisages, bases 
sur la circulation dans les differents fluides physiologiques de forme soluble 
30 de recepteur a un ligand donne. 

L'invention concerne plus particulierement I'utilisation des 
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methodes, acides nucleiques ou banques decrits ci-dessus pour 
Identification de domaines antigeniques specifiques de proteines impliquees 
dans une pathologie. ^invention concerne egalement 1'utilisation des acides 
nucleiques, proteines ou peptides tels que decrits ci-avant pour le diagnostic 
5 de pathologies. 

^invention concerne egalement une methode d'identification 
et/ou de production de proteines ou domaines proteiques impliques dans une 
pathologie comprenant : 

(a) Thybridation des ARN messagers d'un echantillon 
10 pathologique avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux 

en parallele, 

(b) Identification, dans les hybrides formes, des regions 
correspondant aux differences qualitatives (non appariees (ARN) ou 
appariees (ADN double brin)), specifiques de Tetat pathologique par rapport 

15 a I'etat sain, 

(c) Identification et/ou la production de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifies en (b). 

Les regions identifies correspondent generalement a des 
epissages differentiels, mais il peut egalement s'agir d'autres alterations 
20 genetiques telles que insertion(s) ou deletion(s), par exemple. 

La ou les proteines ou domaines proteiques peuvent etre isoles, 
sequences, et utilises dans des applications therapeutiques ou 
diagnostiques, notamment pour la preparation d'anticorps. 

A titre d'exemple plus specifique, le criblage differentiel qualitatif 
25 de Tinvention permet avantageusement de mettre en evidence des genes 
suppresseurs de tumeurs. En effet, de nombreux exemples indiquent que 
Tun des modes deactivation des genes suppresseurs au cours de la 
progression tumorale est une inactivation par modulation de T6pissage de 
formes alternatives. 

30 Ainsi, dans les carcinomes pulmonaires a petites cellules, le 

gene de la proteine p130 qui appartient a la famille RB (proteine du 
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retinoblastome) est mute a un site consensus d'epissage. La consequence 
de cette mutation est lamination de I'exon 2 et une non synthese de 
proteine due a la presence d'un codon stop precoce. Cette observation a ete 
la premiere a souligner 1'importance des membres de la famille RB dans la 
' tumori 9 6n6se - De meme, dans certains cancers du poumon non a petites 
cellules, le gene de la proteine P 16INK4A, proteine qui est un inhibiteur des 
k.nases cyclines-dependantes cdk4 et cdk6 est mute dans un site donneur 
d'epissage. Le resultat de cette mutation est la production d'une proteine 
tronquee a demi-vie courte ce qui a pour consequence I'accumulation des 
formes phosphorylees. inactives, de RB. Par ailleurs, WT1, le gene 
suppresseur de tumeur de Wilms, est transcrit en plusieurs ARN messagers 
generes par epissages alternatifs. Dans les cancers du sein, les proportions 
relat,ves des differents variants sont modifiees par rapport au tissu sain 
fournissant des outils diagnostics et des pistes pour comprendre Importance 
des differents domaines fonctionnels de WT1 dans la progression tumorale 
Ce meme phenomene de modification des rapports entre differentes formes 
d'ARN messagers et d'isoformes proteiques lors de la transformation 
cellulaire est retrouve pour la neurofibrine NF1. En outre, cette notion de 
modulation des phenomenes d'epissage qui signe la progression tumorale 
est soutenue egalement par I'exemple de HDM2 dont 5 epissages alternatifs 
sont detectes dans les carcinomes ovariens et pancreatiques et dont les 
expressions augmentent selon le stade d'avancement tumoral. D'autre part 
dans les cancers de la tete et du cou, I'un des mecanismes d'inactivation de 
P53 implique une mutation dans un site consensus d'epissage. 

Ces quelques exemples listes illustrent tout I'interet des 
techniques de Invention basees sur la recherche systematise des 
var,at.ons d'epissage qui distinguent une tumeur donnee du tissu sain voisin 
Les resultats qui en decoulent permettent en effet non seuiement la 
caracterisation de genes suppresseurs de tumeurs deja connus mais 
egalement, compte tenu de ('aspect original et systematique des techniques 
de criblage differentie. qualitatif, .'identification de nouvelles variations 



BNSDOCID: <WO 9946403A1 J_> 



WO 99/46403 



PCT/FR99/00547 

39 



d'epissages specifiques de tumeurs affectant vraisemblablement de 
nouveaux genes suppresseurs de tumeurs. 

^invention a done egalement pour objet un proc6de 
d'identification et/ou de clonage de genes suppresseurs de tumeurs ou 
5 d'alterations genetiques (e.g., d'epissages) au sein de genes suppresseurs 
de tumeurs, tel que defini ci-avant. Ce procede peut avantageusement 
comprendre les etapes suivantes : 

(a) Thybridation des ARN messagers d'un echantillon de tumeur 
avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux en parallele, 
io (b) Tidentification, dans les hybrides formes, des regions 

specifiques de I'echantillon tumoral par rapport a Petat sain, 

(c) Tidentification et/ou le clonage de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifies en (b). 

Les proprietes suppresseur de tumeur des proteines ou 
15 domaines identifies peuvent ensuite etre testees dans differents modeles 
connus. Ces proteines, ou leur forme native (possedant I'epissage observe 
dans le tissu sain), peuvent ensuite etre utilisees dans des applications 
therapeutiques ou diagnostiques, notamment en therapie genique 
antitu morale. 

20 La presente demande a done egalement pour objet non 

seulement les differents aspects de mise en oeuvre de la technologie mais 
aussi I'exploitation des informations qui en decoulent a des fins de 
recherche, de developpement de criblage de petites molecules chimiques, de 
developpement d'outils de therapie genique ou de diagnostic. 

25 A ce titre, I'invention concerne egalement I'utilisation des 

methodes, acides nucleiques ou banques decrits ci-dessus en 
genotoxicologie, e'est-a-dire pour anticiper (predire) le potentiel toxique de 
composes tests. 

Les programmes genetiques engages lors du traitement de 

30 cellules ou de tissus par des agents toxiques sont en grande partie correles 
aux phenomenes d'apoptose ou mort cellulaire programmee. L'importance 
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des phenomenes d'epissage alternatif dans la regulation de ces voies 
apoptotiques est bien illustree par la literature. Cependant, aucune 
technologie genomique decrite jusqu'a present ne permettait de rechercher 
systematiquement et d'isoler de maniere exhaustive les variations de 
s sequences dues a des epissages alternatifs et distinguant deux situations 
physiopathologiques donnees. Les techniques de criblage different 
qualitatif deve.oppees dans .a presente invention permettent de regrouper 
('ensemble des differences d'epissage qui existent entre deux situations dans 
des banques d'ADNc. La comparaison des sequences d'ARN (par exemple 
les ARN messagers) d'un tissu (ou d'une culture cellulaire) traite ou non avec 
un compose toxique de reference permet d'etablir des banques d'ADNc qui 
regroupent les differences qua.itatives de I'expression genique qui 
caracterisent ( action toxique etudiee. Ces banques d'ADNc peuvent ensuite 
etre hydridees avec des sondes derivees d'ARN extrait des memes tissus ou 
cellules traites avec un produit chimique dont on veut evaluer le potentiel 
tox.que. La plus ou moins grande capacite de ces sondes a s'hybrider avec 
les informations genetiques specifiques d'une situation toxique de reference 
permet de lui assigner un potentiel toxique. Par ailleurs, outre Implication de 
DATAS a la generation et I'utilisation de banques de differences qualitatives 
mduites par des agents toxiques, une partie de ('invention consiste 
egaiement a demontrer que des deregulations dans I'epissage de certains 
ARNs messagers peuvent etre induites par certains agents toxiques, a des 
doses inferieures aux IC50 mesurees dans des tests de cytotoxicite et 
d'apoptose connus de I'homme de I'art. De tel.es deregulations (ou 
dysregulations) peuvent etre uti.isees comme marqueurs pour le suivi de la 
tox,cite et/ou de I'efficacite de molecules (chimiques ou genetiques). 

L'invention concerne done egaiement toute methode de 
detection ou de suivi du potentiel toxique et/ou therapeutique d'un compose 
basee sur la detection de formes et/ou de profi.s d'epissages induits par ce 
compose sur un echantillon bio.ogique. EI.e concerne en outre ('utilisation de 
toute modification de formes et/ou de profils d'epissages comme marqueur 
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pour le suivi de la toxicite et/ou de Pefficacite de molecules. 

(.'evaluation ou le suivi du potentiel toxique peut s'effectuer plus 
particulierement selon deux approches : 

Selon la premiere approche, le criblage differentie! qualitatif 
peut etre realise entre un tissu ou une culture cellulaire de reference, d'une 
part non traite et d'autre part traite par le produit dont on veut evaluer la 
toxicite. L'analyse des clones qui represented les differences qualitatives 
specifiquement induites par le produit permet ensuite eventuellement de 
detecter dans ces clones des evenements caract§ristiques d'ADNc impliques 
dans les phenomenes lies a la toxicite comme I'apoptose. 

L'apparition de ces marqueurs est suivie selon la dose et la 
duree du traitement par le produit et permet une approche de son profil 
toxicologique. 

La presente demande a done egalement pour objet un procede 
d'identification, par criblage differentiel qualitatif selon les techniques 
presentees ci-dessus, de marqueurs de toxicite induits dans un systeme 
biologique modele par un compose chimique dont on veut tester le potentiel 
toxique. A cet egard, Tinvention : concerne notamment un procede 
d'identification et/ou de clonage d'acides nucleiques specifiques d'un etat 
toxique d'un echantillon biologique donne comprenant la preparation de 
banques differentielles qualitatives entre les ADNc et les ARN de I'echantillon 
apres ou sans traitement par un compose toxique test, et la recherche de 
marqueurs de toxicite specifiques des qualites de l^chantilion apres 
traitement. 

Selon la deuxieme approche, des abaques pour differentes 
classes de produits toxiques rassemblent leur profil de toxicite selon les 
doses employees et selon les durees des traitements pour un tissu ou un 
modele cellulaire de reference. A chaque point de ces abaques, des 
banques d'ADNc caracteristiques des differences gen§tiques qualitatives 
peuvent etre etablies. Ces banques sont des banques differentielles 
qualitatives, i.e., elles sont obtenues par extraction des informations 
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genetiques du point choisi dans les abaques at du point corraspondan. au 
modele tissulaira ou callulaire contr6la. Comme cala est illustre dans las 
axamplas, la oriblaga differentiel qualitatif raposa sur fhybridation d'ARNm 
extraits d'une situation avec les ADNc issues tfune autra. Comma indique 
5 plus haul, le oriblaga differential qualitatif paut aire egalement mene a partir 
d'ARN totaux ou d'ARN nucleates contanant las premessagers. 

A cat egard, I'invention oonceme un procede de determination 
ou devaluation da la toxicite d'un compose test sur un echantillon biologique 
donni comprenant I'hybridation : 

- de banques differentielles entre les ADNc et les ARN dudit 
echantillon biologique a fetal sain et t un ou different^ stades de toxicite 
resultant d'un traitement dudit echantillon avec un compose toxique de 
reference, avec, 

- une preparation d'acides nucleiques de I'echantillon biologique 
traite par ledit compose test, et 

- revaluation du potentiel toxique du compose test par analyse 
du degre d'hybridation avec ies differentes banques. 

Selon ce procede, pour cheque situation (doses de compose et/ou 
temps d'incubation), deux hybridations reciproques sont avantageusement 
realisees, entre : 

- les ARN de la situation . A (test) et les ADNc de la 
situation B (reference) ( rA/cB) 

- les ARN de la situation B (reference) et les ADNc de la 
situation A (test) (rB/cA). 

A chaque situation toxique de reference, a chaque point des 
abaques, correspondent done deux banques de criblage differentiel qualitatif 
fune de ces banques regroupe les variations qualitatives, e'est a dire 
notamment les epissages a.ternatifs, specifiques de la situation normale de 
reference alors que .'autre banque rassemble «es epissages specifiques des 
elements toxiques. Ces banques sont repliquees sur des supports so.ides 
te.s des fi,tres de nylon ou de nitrocellulose ou avantageusement sur des 
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chips. Ces banques formees initialement par des fragments d'ADNc de 
longueur variable (selon les evenements d'epissages concernes) peuvent 
etre optimisees par I'emploi d'oligonucleotides derives des sequences isolees 
initialement. 

5 Lorsqu'un compose chimique est propose pour un 

developpement pharmaceutique, il peut etre applique sur les memes 
modeles tissulaires ou cellulaires que ceux repertories dans les abaques de 
toxicite. Des sondes moleculaires peuvent ensuite etre realisees a partir 
d'ARNm extraits des echantillons biologiques traites par le compose 

10 chimique d'interet. Ces sondes sont ensuite hybridees a des filtres portant 
I'ADNc des banques rA/cB et rB/cA. Par exemple, la banque rA/cB peut 
contenir les sequences specifiquement presentes dans la situation normale 
et la banque rB/cA les elements d'epissage alternatifs specifiques de la 
situation de toxicite. L'innocuite ou la toxicite du compose chimique est alors 

15 aisement evaluee en fonction des profils d'hybridation d'une sonde derivee 
d f ARNm extraits du modele tissulalre ou cellulaire de reference traite par le 
compose teste: 

- une hybridation efficace avec la banque rA/cB et aucun 
signal sur la banque rB/cA revele une absence de toxicite du compose sur le 

20 modele etudie 

- ('hybridation de la sonde avec des clones de la banque 
rB/cA indique une toxicite induite par le compose teste. 

Des exemples duplication de constitutions de telles banques 
peuvent etre fournis par des modeles de culture d'hepatocytes, telle la lignee 
25 HepG2, de cellules epith6liales renales, telle la lignee HK-2, ou de cellules 
endothelials, telle la lignee ECV304, traites par des agents toxiques tel 
Tethanol, la camptothecine ou le PMA. 

Un exemple de choix peut egalement etre fourni par Tutilisation 
en cosmetologie de modeles de culture de peau traites ou non par des 
30 agents toxiques ou irritants. 

La presente demande a done egalement pour objet des 
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banques de criblage dffferentiel (entre les ADNc et les ARN), realisees a 
partir d'organes, de tissus ou de cultures cellulaires de reference traites avec 
des composes chimiques representatifs de grandes classes d'agents 
toxiques selon les abaques decrites dans la litterature. L'invention conceme 
5 aussi I'etalement de ces banques sur des filtres ou sur des supports connus 
de I'homme de Part (nitrocellulose, nylon...). Avantageusement ces supports 
peuvent etre des chips ou puces qui definissent ainsi des puces de 
genotoxicite. L'invention concerne en outre Pexploitation qui peut etre faite du 
sequencage des differents clones qui constituent ces banques dans le but 
d'elucider les mecanismes mis en jeu par .'action des differents toxiques 
a.ns. que .'utilisation de ces banques pour les hybrider avec des sondes 
provenant de cellules ou de tissus traites par un compose chimique ou un 
produ.t pharrnaceutique dont on veut evaluer la toxicite. Avantageusement 
invention concerne des banques d'acides nucleiques telles que definies ci- 
avant. preparees a partir de cellules de la peau traitees en differentes 
conditions toxiques. L'invention concerne en outre un kit comprenant ces 
differentes banques differentielles de la peau. 

L'invention concerne egalement Putilisation des methodes 
acdes nucleiques ou banques decrits ci-dessus pour evaluer (predire) ou 
ameliorer le potentiel therapeutique de composes tests 
(genopharmacologie). 

Dans cette uttlisation, le principe mis en application est tt*s 
proche de celui decrit precedemment. Des banques differentielles de 
reference sent toblies entre les ADNc et les ARN d'une culture cellulaire ou 
d'un organe dans une situation contraie et de leur equivalent mimant un 
modele de pathologie. L'effioacite therapeutique d'un produit peut alors etre 
evaluee en suivant sa capacite a antagoniser les variations qualitatives de 
I'expression genique qui sent specifies du modele pathologique Cela est 
m,s en ev,'dence par la modification du profll d'hybridation d'une sonde issue 
du modele pathologique sur les banques de references: sans traitement la 
sonde n'hybride qu'avec la banque qui contient les signatures specifiques de 
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la maladie. Apres traitement avec un produit efficace, la sonde bien que 
provenant du modele pathologique hybride preferentiellement avec I'autre 
banque, qui porte les signatures du modele equivalent sain. 

A cet egard, ('invention concerne egalement un procede de 
5 determination ou devaluation de Tefficacite therapeutique d'un compose test 
sur un echantillon biologique donne comprenant I'hybridation : 

- de banques differehtielles entre les ADNc et les ARN dudit 
echantillon biologique a I'etat sain et a (differents stades de developpement 
de) I'etat pathologique avec, 

io - une preparation d'acides nucleiques de I'echantillon biologique 

traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
analyse du degre d'hybridation avec les differentes banques. 

Un exemple d'une telle application peut etre fourni par un 

is modele d'apoptose mimant certains aspects de la neurodegenerescence qui 
sont antagonises par des facteurs trophiques de reference. Ainsi les cellules 
derivees de pheochromocytomes PC12 differenciees en corps neuronaux en 
presence de NGF entrent en apoptose par retrait de ce facteur de 
croissance. Cette apoptose est accompagnee par expression de nombreux 

20 marqueurs de mort cellulaire programmee dont plusieurs sont regules par 
epissage alternatif et dont I'apparition est inhibee par action d'IGFI. Deux 
banques issues de criblage differentiel qualitatif sont etablies a partir 
d f ARNm extraits de cellules PC12 differenciees entrees en apoptose par 
retrait de NGF d*une part et a partir de PC 12 differenciees sauvegardees de 

25 Tapoptose par ajout d'IGFI d'autre part. Sur ces banques peuvent etre 
hybridees des sondes realisees a partir d'ARNm extraits de PC12 
differenciees entrees en apoptose et dont la survie est am6lioree par 
traitement avec un produit neuroprotecteur a tester. L'efficacite de Inversion 
des caracteristiques qualitatives induites par le compose test peut done etre 

30 appreciee par la capacite de la sonde a hybrider specifiquement les clones 
specifiques de la banque representative des cellules dont la survie est 
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amelioree. Ce test peut par la suite etre utilise pour tester I'efficacite de 
denves du compose ou de tout autre nouvelle famille de composes 
neuroprotecteurs et en ameliorer le profil pharmacologique. 

Dans un mode de realisation particuiier, le procede de 
s Invention permet d'eva.uer I'efficacite d'une compose test neuroprotecteur 
par hybridation avec une banque differentielle selon Invention entre une 
cellule nerveuse saine et cette cellule presentant un modele de 
neurodegenerescence. 

Dans un autre mode, il s'agit de tester un compose anti-tumoral 
sur des banques differences etablies a partir d'un echantillon de cellules 
tumorales et un echantillon sain. 

Comme indique ci-avant, le procede de Invention peut en outre 
etre utilise pour ameliorer les propriety d'un compose, en testant differents 
denves pour leur capacite a induire un profil d'hybridation proche de la 
banque representative de I'echantillon sain. 

[-'invention concerne egalement ('utilisation des methodes 
acides nucleiques ou banques decrits ci-dessus en pharmacogenomique,' 
..e., pour evaluer (predire) la reponse d'un patient a un compose ou 
traitement test. 

La pharmacogenomique a pour ambition d'etablir des profils 
genetiques de patients afin de determiner quel traitement est susceptible 
d'etre couronne de succes pour une pathologie donnee. Les techniques 
decntes dans la presente invention permettent a cet egatd d'etablir des 
banques d'ADNc representatives des differences qualities qui existent 
entre une situation pathologique qui repond 4 un traitement donne et une 
autre qu, repond peu ou mal, susceptible d'Stre I'objet d'une autre strategie 
therapeutique. Cos banques de references etablies. elles peuvent etre 
hybridees avec des sondes realises a partir d'ARN messagers de patients 
Les resultats d'hybridation permettent de savoir que. patient a un pro fil 
d'hybridation correspondent a la situation de repondeurou de non repondeur 
et ainsi d'affiner le choix de traitement. 
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Dans cette application, le but est d'une part de proposer en 
fonction du patient le traitement le plus approprte, le plus susceptible d'etre 
couronne de succes et d'autre part d'enroler dans un traitement les patients 
les plus susceptibles d'y repondre avec succes. Comme dans les autres 
5 applications, deux banques de criblage differentiel qualitatif sont realisees: 
Tune a partir d'un modele ou d'un echantillon pathologique connu pour 
repondre a un traitement, I'autre a partir d'un autre modele ou echantillon 
pathologique qui repond peu ou mal a Taction therapeutique. Ces deux 
banques sont ensuite hybridees avec des sondes provenant d'ARNm extraits 

10 de biopsies de differents patients. Selon que ces sondes hybrident 
preferentiellement avec les epissages alternatifs specifiques de Tune ou 
I'autre situation, les patients peu vent etre repartis en repondeurs et en non 
repondeurs au traitement de reference qui a defini les modeles de depart. 

A cet egard, Tinvention concerne egalement un procede de 

15 determination ou devaluation de la reponse d'un patient a un compost ou 
traitement test comprenant Phybridation : 

- de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-repondeur ou mal-repondeur audit 

20 compose/traitement, avec, 

- une preparation d'acides nucleiques d'un echantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

25 Un exemple de choix de I'apport du criblage differentiel qualitatif 

a la pharmacogenomique est constitue par un criblage differentiel qualitatif 
entre deux tumeurs de meme origine histologique, I'une r6gressant lors du 
traitement par un compose antitumoral (par exemple un transfer! d'un ADNc 
codant pour la proteine p53 sauvage par therapie genique), I'autre se 

30 montrant refractaire a ce traitement. La premiere retombee de la constitution 
de banques de differences qualitatives entre ces deux situations est de 
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determiner, par analyse des clones qui constituent ces banques. quels 
mecanismes moleculaires sont mobilises lors de la regression du premier 
modele et ne sont pas presents dans le deuxieme. 

Ensuite, ('utilisation de filtres ou tout autre support presentant les 
ADNc.de ces banques permet de realiser des hybridations avec des sondes 
derivees d'ARNm de biopsies de tumeurs dont on veut anticiper la reponse 
audit traitement. Ces resultats permettent ainsi de proposer un enrolement 
optimise des patients dans un protocole clinique. 

Un exemple particulier de ce procede consiste a determiner la 
reponse de tumeurs a un traitement par le gene suppresses de tumeur p53 
II a en effet ete decrit que certains patients et certaines tumeurs repondent 
plus ou moins bien a ce type de traitement (Roth et al., Nature Medicine, 2 
(1995) 958). II est done important de pouvoir determiner quels types de 
tumeurs et/ou quels patients sont sensibles a un traitement par therapie 
genique par p53 sauvage, afin d'optimiser le traitement et de favoriser 
I'enrolement des patients dans les essais cliniques en cours. Le procede de 
Invention permet avantageusement de faciliter ces etapes en proposant des 
banques specifiques des qualites de cellules repondeuses et de cellules non 
repondeuses a p53. Des exemples de mode.es ce.lulaires P 53-sensibles ou 
resistants sont decrits par exemple par Sabbatini et al. (Genes Dev. 9 (1995) 
2184) ou par Roemer et al. (Oncogene 12 (1996) 2069). L'hybridation de ces 
banques avec des sondes derivees de biopsies de patients permet aisement 
d'evaluer leur potentie, repondeur. En outre les banques specifiques 
permettent ega.ement d'identifier des acides nucleiques impliques dans la 
25 reponse a p53. 

La presente demande conceme done egalement 
I'etablissement de banques de criblage differentiel 4 partir d'eehantillons 
pathologiques. ou de modeles de pamologie. qui repondent differemment a 
au moins un agent pharmacologique. Ces banques peuvent «re des 
30 banques restreintes, complexes ou eutologues oomme definies oi-dessus 
Elle oonceme aussi I'etalement de oes banques sur des filtres ou sur des 
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supports connus de I'homme de Tart (nitrocellulose, nylon...). 
Avantageusement ces supports peuvent etre des chips ou puces qui 
definissent ainsi des puces de pharmacogenomique. L'invention porte encore 
sur Texploitation qui peut etre faite du sequengage des differents clones qui 
5 constituent ces banques dans le but d'elucider les mecanismes qui president 
aux differences de reponses d'echantillons pathologiques a differents 
traitement, ainsi que 1'utilisation de ces banques pour les hybrider avec des 
sondes provenant de biopsies provenant de situations pathologiques dont on 
veut anticiper la reponse au traitement de reference qui definit les banques. 

io La presente invention decrit ainsi que des variations dans les 

formes et/ou profils d'epissages constituent des sources de marqueurs de 
pharmacogenomique, c'est-a-dire des sources de marqueurs permettant la 
mise en evidence de la capacite et de la maniere d'un patient a repondre a 
des traitements. A cet egard, l'invention a done egalement pour objet 

is I'utilisation de Pintervariabilite, entre individus, des isoformes generees par 
epissage alternatif (analyse du spliceome) comme source de marqueurs de 
pharmacogenomique. L'invention concerne aussi I'utilisation de modifications 
d'epissage induites par des traitements comme source de marqueurs de 
pharmacogenomique. Ainsi, comme explique ci-avant, les methodologies 

20 DATAS de ('invention permettent de generer des acides nucleiques 
representatifs des differences qualitatives entre deux echantillons 
biologiques. Ces acides nucleiques, ou des formes derivees (sondes, 
amorces, acides complementaires, etc.) peuvent etre utilises pour I'analyse 
du spliceome de sujets, en vue de mettre en evidence leur capacite/maniere 

25 de repondre a des traitements, ou leur predisposition a tel 
traitement/pathologie, etc. 

Ces differents exemples generaux illustrent llnteret des 
banques de criblage differentiel qualitatif dans des etudes de genotoxicite, 
30 genopharmacologie, pharmacogenomique ainsi que dans des recherches de 
cibles d'interet diagnostique ou therapeutique. Ces banques sont issues du 
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clonage des differences qualitatives qui existent entre deux situations 
physiopathologiques. Puisqu'une autre utilisation des ADNc representatifs de 
ces differences qualitatives est de constituer des sondes destinees a cribler 
une banque d'ADN genomique dont les caracteristiques ont ete decrites ci 
5 avant, une telle approche peut etre egalement mise en ceuvre pour toute 
etude de genotoxicite, genopharmacologie et pharmacogenomique ainsi que 
d'identification de gene. Dans les etudes de genotoxicite par exemple, les 
clones genomiques restreints par la taille de leurs insertions statistiquement 
a un seul intron ou a un seul exon sont classes sur des filtres en fonction de 
io leur hybridation avec des sondes DATAS provenant de ('analyse difference 
qualitative entre une population cellulaire ou un tissu de reference et les 
memes cellules ou tissu traites par un compose toxique de reference. Ces 
clones representatifs des differentes classes de toxicite etant selectionnes, il 
peut ensuite etre procede a une hybridation de ces clones avec une sonde 
is derivee des ARN messagers totaux d;une meme population cellulaire ou d'un 
meme tissu traite par un compose doht on veut apprecier le potentiel toxique. 

D'autres avantages et applications de la presente invention 
apparattront a la lecture des exemples qui suivent, qui doivent etre 
cbnsideres comme illustratifs et non limitatifs. Les champs duplication de 
20 I'invention sont represents sur la figure 7. 

LEGENDF DF S FIG1JRFR 

Figure 1. Representation scheniatique des criblages differentiels selon 
25 I'invention (figure 1A) utilisant une (figure 1B) ou deux (figure 1C) 
hybridations, et utilisation des acides nucleiques (figure 1 D). 

Figure 2. Representation schematique decrivant I'obtention d'hybrides 
ARN/ADN permettant de caracteriser les sequences ARN simple brin, 
30 signatures specifiques de I'etat pathologique ou de I'etat sain. 
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Figure 3. Representation schematique decrivant un moyen permettant 
d'isoler et de caracteriser par sequencage les sequences d'ARN simple brin 
specifiques d'une situation pathologique ou d'une situation saine. 

5 Figure 4. Representation schematique decrivant un autre moyen 

permettant de caracteriser par sequengage tout ou une partie des ARNs 
simple brin specifiques d'une situation pathologique ou d'une situation saine. 

Figure 5. Representation schematique permettant d'isoler les produits 
10 d'epissages alternatifs grace a des structures R-loop 

Figure 6. Representation schematique du criblage differentiel qualitatif 
par restriction de boucles (formation d'homoduplexes ADNcdb/ADNc et 
extractions des informations, Figure 6A) et description des informations 
15 obtenues (Figure 6B). 

Figure 7. Apports du criblage differentiel qualitatif aux differentes 
etapes de la recherche et du developpement pharmaceutique. 

20 Figure 8. Isolation d'un domaine differentiellement episse dans le 

modele grb2/grb33. A) Production des ARNs synthetiques de grb2 et de 
grb33. B) Suivi des premieres etapes de DATAS conduisant a ia 
caracterisation d'un fragment ARN correspondant au domaine 
differentiellement episse ; 1 : ARN de grb2, 2 : Hybridation entre I'ARN de 

25 grb2 et I'ADNc de grb33, 3 : Hybridation entre I'ARN de grb2 et I'ADNc de 
grb2, 4 : Hybridation entre I'ARN de grb2 et de I'eau, 5 : Surnageant apres 
passage sur billes Streptavidine de (2), 6 : Surnageant apres passage sur 
billes Streptavidine de (3), 7: Surnageant apres passage sur billes 
Streptavidine de (4), 8 : Digestion du duplex ARN grb2 / ADNc grb33 a la 

30 Rnase H, 9 : Digestion du duplex ARN grb2 / ADNc grb2 a la Rnase H, 10 : 
Digestion de I'ARN grb2 a la Rnase H, 1 1 : pareil que (8) apres passage sur 



BNSDOCID: <WO 9946403A1_I_> 



W ° 99/46403 PCT/FR99/00547 



10 



52 



colomne d'exclusion, 12 : pareil que (9) apres passage sur colomne 
d'exclusion, 13 : pareil que (10) apres passage sur colomne d'exclusion. 

Figure 9 . Representation des populations d'ARNs non appariees 
issues de la digestion par la Rnase H a partir de duplexes ARN / ADNc 
simple brin provenant de cellules HepG2 traitees ou non a I'ethanol. 

Figure 10. Representation des populations d'ADNc double brin 
generees par une des variantes de DATAS. 1 a 12 : PCRs a partir de 
populations de boucles d'ARNs issues de la digestion a la Rnase H, 13 : 
PCR a partir d'ADNc totai. 



15 



20 



25 



Figure 11. Application de la variante de DATAS faisant intervenir les 
ADNc double brin sur le modele grb2/grb33. A) Analyse sur gel d'agarose 
des complexes apres hybridation : 1 : ADNc double brin grt>2 / ARN grb33, 
2 : ADNc double brin grb2 /ARN grb2, 3 : ADNc double brin grb2 / eau. B) 
Digestion des echantillons 1,2 et 3 de A) par la nuclease S1 et la nuclease 
" Mung Bean " : 1 a 3 : complexes 1 a 3 avant traitement au glyoxal ; 4 a 6 : 
complexes 1 a 3 apres traitement au glyoxal ; 7 a 9 : Digestions de 1 a 3 par 
nuclease S1 ; 10 a 12 : Digestions de 1 a 3 par nuclease Mung Bean. 

Figure 12. Application de la variante de DATAS faisant intervenir les 
ADNc simple brin et la Rnase H sur un systeme de cellules HepG2 traitees 
ou non a I'ethanol 0.1M pendant 18 heures. Les inserts clones ont ete 
transfers sur membrane apres electrophorese sur gel d'agarose et soumis a 
hybridation a I'aide de sondes correspondant aux situations traitees (Tr) ou 
non (NT). 



30 produit. 



Figure 13. Mode operatoire pour evaluer le potentiel toxique d'un 

r 
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Figure 14. Mode operatoire pour suivre I'efficacite d'un produit. 

Figure 15. Mode operatoire pour etudier la susceptibilite d'une 
situation pathologique a un traitement. 

5 

Figure 16. Analyse d' hybridation differentielle de clones issus de 
DATAS a partir d'ARNs extraits de cellules induites et d'ADNc extraits de 
cellules non induites. A) Utilisation de colonies bacteriennes deposees et 
lysees sur membrane. B) Southern Blot effectue a partir d'une selection de 
10 clones de A. 

Figure 17. Sequences nucleotidique et peptidique de ASHC (SEQ ID 
NO: 9et 10). 

15 Figure 18. Tests de cytotoxicite et d'apoptose sur cellules HepG2 

traitees A) a lethanol ; B) a la camptothecine ; C) au PMA. 

Figure 19. Reactions de RT-PCR effectuees a partir d'ARNs extraits 
de cellules HepG2 traitees ou non (NT) par I'ethanol (Eth.), la camptothecine 
20 (Camp.) et le PMA (PMA) permettant ('amplification de fragments 
correspondants a des domaines de MACH-a, BCL-X, FASR et beta-actine 
comme controle de normalisation. 

Dans les exemples et la description de I'invention, il est fait references 
25 aux sequences de la Liste de Sequences, qui contient le texte libre suivant: 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 
30 <223> OLIGO 

<223> OLIGO 
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<223> QLIGO 
<223> OLIGO 
<223> OLIGO 
<223> OLIGO 
<223> OLIGO 
<223> OLIGO 

EXEMPLFR 



1. CLONAGE DIFFERENTIEL DES EPISSAGES ALTERNATIFS ET 
AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc SIMPLE-BRINS 

Les ARN messagers correspondant a deux situations, I'une normale 
is (mN) et rautre pathologique (mP), sont isoles a partir de biopsies ou de 
cellules en culture. Ces ARN messagers sont convertis en ADN 
complementaires (cN) et (cP) a I'aide de reverse transcriptase (RT). Des 
hybrides mN/cP et cN/mP sont ensuite realises en phase liquide (se reporter 
au schema de la figure 2 illustrant un des deux cas aboutissant a la 
20 formation de cN/mP). 

Ces hybrides sont avantageusement realises en emulsion phenolique 
(technique PERT ou Phenol Emulsion DNA Reassociation Technique) 
maintenue par thermocycles (Miller, R.,D. and Riblet, R.. 1995, Nucleic Acids 
Research, vol 23, n»12, pp 2339-2340). Typiquement, cette etape 
d'hybridation est realisee entre 0,1 a 1 ng d'ARN polyA + et 0,1 a 2^g d'ADN 
complementaire dans une emulsion formee d'une phase aqueuse (tampon 
Phosphate de sodium 120mM, NaCI 2.5M, EDTA 10mM) et d'une phase 
organique representant 8% de la phase aqueuse et constitute de phenol 
bidistille. 

Une autre technique est egalement avantageusement 
employee de facon a obtenir des heteroduplex : a Tissue de la transcription 
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inverse, I'ADNc neosynthetise est separe de I'amorce oligodT biotinylee sur 
colonne d'exclusion. 0,1 a 2jig de cet ADNc est coprecipite avec 0,1 a *\ng 
d'ARN polyA+ en presence de 0,3M d'acetate de sodium et de deux volumes 
d'ethanol. Ces acides nucleiques coprecipites sont repris dans 30jj.I d'un 
5 tampon d'hybridation qui contient 80% de formamide, 40mM de PIPES 
(piperazinebis(2-ethanesulfonic acid)) ph6,4, 0.4M de NaCI et 1mM d'EDTA. 

Les acides nucleiques en solution sont denatures par chauffage 
10mn a 85°C puis leur hybridation est realisee pendant au moins 16h et 
jusqu'a 48h a 40°C. 

io L'interet de la technique d'hybridation en formamide est de 

permettre des conditions de plus forte selectivity lors de I'appariement des 
brins d'ADNc et d'ARN. 

A Tissue de chacune de ces deux techniques d'hybridation, 
nous disposons d'heteroduplex ARN/ADN dont la perfection d'appariement 

15 depend de I'efficacite de la RT a synthetiser la longueur totale des ADNc. 
Demeurent egalement sous forme de simples brins les regions d'ARN (et 
d'ADN) qui correspondent aux epissages alternatifs qui differencient les deux 
etats physiopathologiques etudies. ■ 

Le but de la methode est ensuite de caracteriser I'information 

20 genetique portee par ces boucles d'epissage. 

Pour cela, les heteroduplex sont purifies par capture des ADNc 
(amorces avec des oligodT biotinyles) grace a des billes portant des 
groupements streptavidines. Avantageusement ces billes sont de billes 
douees de proprietes magnetiques, ce qui permet de les separer des ARN 

25 non engages dans les heteroduplex par action d'un separateur magnetique. 
De telles billes et de tels separateurs sont disponibles commercialement. 

Sont isoles a ce stade de la procedure les heteroduplex et les 
ADNc non engages dans des hybridations avec des ARN. Ce materiel est 
ensuite soumis a Taction de la RNaseH qui va specifiquement hydrolyser les 

30 regions d'ARN hybridees avec les ADNc. Les produits resultant de cette 
hydrolyse sont d'une part les ADNc et d'autre part les fragments d'ARN qui 
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correspondent aux boucles d'epissage ou aux regions non hybridees du fait 
du rendemen. partial de la transcriptase inverse. Les fragments d'ARN sent 
separes de I'ADN par separation magnetique salon le meme mode 
operatoire qua celui mentionne plus haut e. par digestion avec de la DNase 
s exempte de toute contamination par une activite Rnase. 

msUM ation de la techno oatas m u. ^it h 

d epissapa rtu ga n = ^ rh -> 

Una mise en evidence de la faisabilite da cette approche a ete 
realisee sur un systeme in-vifro utilisant un ARN correspondent a ,a region 
oodante de Grb2 d'une par. e, un ADNc simple brin complemented a ,a 
region codante de Grb3.3. Grb 2 est un gene possedan. une phase codante 
de 651 paires de bases. Grb33 est une isoforme de grb2 generee par 
e P ,ssaga alternatif et comprenant une deletion de 121 paires de bases dans 
le domaine fonctionnel SH2 de grb2 (Path etal, Science (igg 4 ) 264 971-4) 
Les ARNs de Grb2 e. de Grb33 son, synthases selon ,es techniques 
connues de I'homme du metier a parlir d un plasmide contenan, ,a sequence 
codante de Grb2 ou de Grb33 sous confreie du promoleur T7 a ,'aide du kit 
RiboMax (Promega). Lanalyse des pmduits demontre une synthese 
homogene (figure 8A). Dans un but de visualisation. I'ARN de Grb2 a 
egalemen, ate rendu radioaclit par incorporation, d'une base marquee lore de 
le .ranscripfion in-vi,ro a I'aide du Ki, Ri boPr obe (Promega,. Les ADNc de 
G*2 e, de Grb3.3 on, ete syn.he.ises par Inscription inverse a partir des 
ARNs synthetiques pnaduits ci-dessus. du Ki, Superscript II (Life 
Technologies) et d'une amorce oligonucleotide biotinylee commune a 
G*2 at a Grb33 correspondent au complemented de la sequence (618- 
639) de GrbZ Les ARNs e, ADNcs on, ete trai.es selon les indications des 
lourmsseurs (promega. Life Technologies), purifies sur oolonne d'exclusion 
(Rnase free sephadex G25 ou G50, 5 Prime. 3 Prime, e, quanlifies par 
spectrophotometrie. 

Les premieres etapes de DATAS ont ete appliquees en 
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associant, en suspension 10ng d'ARN marque de Grb2 avec : 

1 . 1 00 ng d'ADNc de grb33 biotinyle, 

2. 100 ng d'ADNc de grb2 biotinyle, 

3. de I'eau 

dans 30 ul d'un tampon d'hybridation qui contient 80% de formamide, 40 mM 
PIPES (pH 6,4), 0,4 M NaCI, 1 mM EDTA. Les acides nucleiques sont 
denatures par chauffage 10 mn a 85 °C, puis I'hybridation est realisee 
pendant 16 heures a 40°C. Apres capture a I'aide de billes streptavidine, les 
echantillons sont traites a la RNase H comme decrit precedemment. 

L'analyse de ces etapes est realisee par electrophorese sur gel 
d'acrylamide a 6% suivi d'un traitement des gels a I'aide d'un Instant Imager 
(Packard Instruments) permettant la qualification et la quantification des 
especes issues de I'ARN de grb2 marque (figure 8B). Ainsi, les puits 2,3 et 4 
indiquent que les duplexes grb2/grt>33 et grb2/grb2 se sont formes de facon 
quantitative. La migration du complexe grb2/grb33 est retardee par rapport a 
celle de I'ARN de grb2 (puits 2) alors que celle du complexe grb2/grb2 est 
augmentee (puits 3). Les puits 5,6 et 7 correspondent aux echantillons non 
retenus par les billes streptavidine demontrant que 80% des complexes 
grb2/grb33 et grb2/grb2 ont ete retenus sur les billes alors que I'ARN de grb2 
seul, non biotinyle, se retrouve exclusivement dans le surnageant des billes. 
Le traitement a la Rnase H libera, outre les nucleotides libres qui migrant 
plus vite que le bleu de Bromophenol (BPB) une espece migrant en deca du 
bleu de xylene Cyanol (XC) (marque par une fleche sur la figure) et ce 
specifiquement dans le puits 8 correspondant au complexe grb2/grb33 par 
rapport aux puits 9 et 10 qui correspondent au complexe grb2/grb2 et a 
I'ARN de grb2. Les puits 1 1,12 et 13 correspondent aux puits 8,9 et 10 apres 
passage des echantillons sur une colomne d'exclusion pour eliminer les 
nucleotides libres. La migration observee dans les puits 8 et 11 est celle 
attendue pour une molecule d'ARN correspondant a la deletion de 121 
nucleotides differenciant grb2 de grt>33. 

Ce resultat montre bien la possibility d'obtenir les boucles 
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d'ARN generees. par la formation d'heteroduplex entre deux sequences 
derivees de deux isoformes d'epissage. 

LZ Application de la tecimiQUfi hatar 4 . ia 9 ^n^ m t.v,p 
5 Ungues quqlitatjyes de cellules henafin,,^ h^ c ... 6tat Rain ot 

Une situation plus complexe a ete etudiee. Dans le cadre de 
('application de la technologie DATAS comme outil predictif de toxicite de 
molecules, des cellules humaines de type hepatocytaire, HepG2, ont ete 
traitees par de I'ethanol 0,1 M pendant 18 heures. Les ARNs ont ete extraits 
a partir des cellules traitees ou non. La variante de DATAS decrite ci-dessus 
(preparation d'ADNc sb biotinyles, hybridations croisees en phase liquide, 
application d'un champs magnetique pour separer les especes, traitemeni 
RNaseH) a ete appliquee avec les cellules non traitees en situation de 
reference (ou situation A) et les cellules traitees en situation test (ou situation 
B) (figure 9). Les ARNs extraits n'etant pas marques radioactivement , la 
visualisation des populations d'ARN generees par digestion a la RnaseH est 
realisee en effectuant une reaction d'echange du phosphate en 5' des ARNs 
par un phosphate marque, a I'aide de polynucleotide kinase de T4 et de 
gamma-P 32 ATP. Ces marquages sont ensuite deposes sur un gel 
d'acrylamide/uree et analyses par exposition a I'aide d'un Instant Imager 
(Packard Instruments). Des signatures complexes issues des hybridations 
A/B et B/A peuvent alors etre visualisees avec un premier groupe de signaux 
migrant faiblement dans le gel et correspondant a des sequences d'acides 
nucleiques de faille importante et un deuxieme groupe de signaux migrant 
entre 25 et 500 nucleotides. Ces signatures sont d'intensite beaucoup plus 
faible a partir de la situation A/A suggerant que I'ethanol peut induire une 
reprogrammation de I'epissage des ARNs, traduite par I'existence de signaux 
en A/B et B/A. 



1.3. Clonaqe et Preparation d* hnnm,™ a pa rt j r ^ nrhr - 
nucleiques identifi^R 
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Plusieurs variantes experimental sont ensuite envisageables 
pour doner ces fragments cTARN resistant a Taction de la Rnase H: 

A. Une premiere approche consiste a isoler ces boucles et a les 
5 doner (Figure 3). 

Selon cette approche, il est precede a une ligation 
d'oligonucleotides a chacune des extremites par action de la RNA ligase 
selon les conditions connues de Thomme de Tart. Ces oligonucleotides sont 
ensuite utilises comme amorces pour effectuer une RT PCR. Les produits de 
10 PCR sont clones et cribles avec des sondes d'ADN complementaires totales 
correspondant aux deux situations physiopathologiques d'interet. Seuls les 
clones hybridant preferentiellement avec une seule des deux sondes 
contiennent les boucles d'epissage qui sont ensuite sequencees et/ou 
utilisees pour generer des banques. 

15 

B. La seconde approche (Figure 4) consiste a effectuer une 
transcription inverse sur TARN simple brin libere des heteroduplex apres 
action de la RNaseH, initiee a I'aide d'amorces au moins en partie aleatoires. 
Ainsi, il peut s'agir d'amorces aleatoires en 3' et en 5', d'amorces aleatoires 

20 en 3' et determinees en 5', ou encore d'oligonucleotides semi-aleatoires, 
dest-a-dire comprenant une zone de degen§rescence et une zone d6finie. 

Selon cette strategie, les amorces sont done susceptibles de 
s'hybrider soit n'importe ou sur TARN simple brin, soit a chaque succession 
de bases fixee par le choix de I'amorce semi-aleatoire. Une PCR avec des 

25 amorces correspondant aux oligonucleotides decrits ci-dessus permet 
ensuite d'obtenir des sequences d6rivees des boucles d'epissage. 

La figure 10 (puits 13 12) montre I'analyse sur gel d'acrylamide 
des fragments de PCR obtenus a partir de plusieurs essais DATAS et 
couplee a Tutilisation des oligonucleotides semi-aleatoires suivants: 

30 GAGAAGCGTTATNNNNNNNAGGT (SEQ ID NO: 1 , X=T) 
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GAGAAGCGTTATNNNNNNNAGGA (SEQ ID NO: 1, X=A) 

GAGAAGCGTTATNNNNNNNAGGC (SEQ ID NO: 1, X=C) 
GAGAAGCGTTATNNNNNNNAGGG (SEQ ID NO: 1 , X=G) 
La comparaison avec la complexity des signaux obtenus en 
5 utilisant les memes oligonucleotides, mais de I'ADNc total comme matrice 
(puits 13) demontre que DATAS a permis de filtrer ("profiler) des 
informations correspondant a des differences qualitatives. 

Cette variante a ete utilisee afin de doner un evenement 
correspondant au domaine ARN de grb2 genere par action de la Rnase H a 
io partir du duplex ARN grb2 / ADNc simple brin de grb33 selon le protocole 
decrit precedemment (exemple 1.1.). A cette fin, un oligonucleotide de 
sequence : GAGAAGCGTTATNNNNNNNNTCCC (SEQ ID NO: 2), choisi sur 
le modele GAGAAGCGTTATNNNNNNNWXYZ (dans lequel N est defini 
comme precedemment, W, X et Y represented chacun une base fixe 
15 determines et Z represente soit une base determinee soit un groupe 3'-OH, 
SEQ ID NO: 3) et selectionne pour amplifier un fragment dans la deletion de 
grb2 a ete utilise, permettant de generer un fragment PCR dont le clonage et 
le sequencage a demontre qu'il etait effectivement issu du domaine delete 
de grb2 (194-281 dans grb2). 

20 

Ces deux approches permettent done la production de 
compositions d'acides nucleiques representatifs des epissages differentiels 
dans les deux situations testees qui peuvent etre employees comme sondes 
ou pour construire des banques d'ADNc de differences qualitatives. La 
25 capacite de la technologie DATAS a generer des banques profilees d'ADNc 
representatives de differences qualitatives est egalement illustree par 
I'exemple 1.4. suivant. 

1.4. Production de hann.ies nmfil^c r e > P r^nt a ti^c h q 
30 Pellules endothelials hnmpjnoc 

Cet exemple a ete realise a partir d'une lignee de cellules 
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endothelials humaines (ECV304). L'analyse qualitative de Texpression 
genetique a ete r6alisee a partir d'ARN cytosoliques extraits de cellules en 
proliferation, d'une part, et de cellules en anoTkis (apoptose par privation de 
support d'attachement), d'autre part. 
5 Les cellules ECV ont ete cultivees en milieu 199 supplements 

en sels de Earle (Life Sciences). Leur mise en anoTkis a et6 r6alisee par 
passage pendant 4 heures sur boTtes de culture traitees au polyHEMA. Lors 
de la preparation des ARN, les cellules ont ete lysees dans un tampon 
contenant du Nonidet P-40. Les noyaux sont ensuite ecartes par 

10 centrifugation. La solution d'extrait cytoplasmique a 6te ensuite ajustee de 
maniere a fixer de fagon specifique TARN a la matrice de silice Rneasy selon 
les instructions de la societe Qiagen. Apres lavage, les ARN totaux sont 
elues dans de I'eau traitee au DEPC. Les ARNs messagers sont prepares a 
partir des ARNs totaux par separation sur billes magnetiques Dynabeads 

is oligo (dT) 25 (Dynal). Apres avoir mis en suspension les billes dans un 
tampon de fixation, TARN total est incube pendant 5 min a temperature 
ambiante. Apres separation magnetique et lavage, les billes sont reprises 
dans un tampon d'elution pour une incubation a 65°C qui libere les ARNs 
messagers. 

20 Les syntheses d'ADN premier brin sont effectuees a partir des 

ARNs messagers en utilisant la Reverse Transcriptase Superscript II ou 
ThermoScript (Life Technologies) a Taide d'amorces olido (dT). Apres 
RnaseH, les nucleotides libres sont elimines par passage sur colonne 
Sephadex G50 (5 Prime- 3 Prime). Apres extraction au phenol / 

25 Chloroforme et precipitation a I'ethanol, les 6chantillons sont quantifies par 
absorbance UV. 

Les quantites requises d'ARN et d'ADNc (en Toccurrence 
200ng de chaque) sont combinees et precipitees a I'ethanol. Les 
6chantillons sont repris dans un volume de 30jil dans un tampon 
30 d'hybridation (Hepes (pH 7.2) 40 mM, NaCI 400mM, EDTA 1mM) 
supplements de formamide desionisee (80% (v/v), sauf indication contraire). 
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Apres denaturation 5 min a 70°C, les echantillons sont incubes sur la nuit a 
40°C. 

Les billes Streptavidine (Dynal) sont lavees puis 
reconditionnees dans un tampon de fixation (2X= Tris-HCI (pH 7,5) 10 mM, 
5 NaCI 2M, EDTA 1 mM). Les echantillons d'hybridation sont amenes a un 
volume de 200 ul avec de I'eau puis ajustes a 200 nl de billes pour une 
incubation de 60 min a 30°C. Apres capture sur aimant et lavages des billes, 
celles-ci sont reprises dans 150 M l de tampon RnaseH puis incubees 
pendant 20 min a 37°C. Apres capture sur aimant, les regions non hybridees 
ont ete relarguees dans le surnageant qui est traite a la Dnase puis extrait 
au phenol acide / chloroforme puis precipite a I'ethanol. Les precipitations a 
I'ethanol de faibles quantites d'acides nucleiques sont effectuees a I'aide 
d'un polymere commercial SeeDNA (Amersham Pharmacia Biotech) 
permettant de recuperer de facon quantitative des acides nucleiques a partir 
15 de solutions tres diluees (de I'ordre du ng/ml). 

La synthese d'ADNc a partir des echantillons d'ARNs 
provenant de Taction de la RnaseH est effectuee a partir d'hexanucleotides 
aleatoires a I'aide de Superscript II Reverse Transcriptase. L'ARN est 
ensuite degrade a I'aide d'un melange de RnaseH et de Rnase T1. 
L'amorce, les nucleotides non incorpores et les enzymes sont separes de 
I'ADNc a I'aide d'une cartouche " GlassMAX Spin ". L'ADNc correspondant 
aux boucles d'epissage est ensuite soumis a une reaction de PCR en 
utilisant des oligonucleotides de type semi-aleatoire deja decrits plus haut 
dans I'invention. En I'occurrence les oligonucleotides choisis sont : 
25 G AG AAG CGTTATN N N N N CCA (SEQ ID NO: 4) 

La reaction de PCR est realisee a I'aide de Taq Polymerase sur 30 
cycles : 

• Denaturation initiale : 94°C pdt 1 min. 

• 94°C pdt 30 s 
30 • 55°C pdt 30s 

• 72°C pdt 30s 



20 
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• Extension finale : 72°C pdt 5 min. 

Les produits de PCR ont ete clones dans le vecteur pGEM-T 
(Promega) possedant un T flottant aux extremites 3' afin de faciliter le 
clonage de fragments issus de I'activite de la Taq Polymerase. Apres 
5 transformation dans les bacteries JM109 competentes (Promega), les 
colonies obtenues sont repiquees sur filtre de nitrocellulose, et hybridees 
avec des sondes derivees de produits de PCR effectuees sur des ADNc 
totaux des cellules en proliferation d'une part et en anoikis d'autre part. Pour 
ces PCR les memes oligonucleotides GAGAAGCGTTATNNNNNCCA sont 
10 utilises. Dans une premiere realisation experimentale, 34 clones hybridant 
pr6ferentiellement avec la sonde des cellules en apoptose et 13 clones 
hybridant preferentiellement avec la sonde des cellules en proliferation ont 
ete isoles. 

Parmi ces 13 clones, 3 clones contiennent le meme fragment 
d'ADNc qui derive du domaine SH2 de la proteine SHC. 

La sequence de ce fragment est la suivante : 
CCACACCTGGCCAGTATGTGCTCACTGGCTTGCAGAGTGGGCAG 
CCAGCCTAAGCATTTGCACTGG (SEQ ID NO: 5) 

L'utilisation d'amorces de PCR qui encadrent le domaine SH2 
de SHC (oligo5' : GGGACCTGTTTGACATGAAGCCC (SEQ ID NO:6) ; 
oligo3': CAGTTTCCGCTCCACAGGTTGC (SEQ ID NO:7)) a permis de 
caracteriser la deletion du domaine SH2 de SHC qui est observee 
specifiquement dans les cellules ECV en anoikis. Avec ce couple d'amorce, 
un seul produit d'amplification correspondant a un fragment d'ADNc de 382 
paires de bases qui contient le domaine SH2 integre est obtenu a partir 
d'ARN de cellules ECV en phase exponentielle. Un fragment additionnel de 
287 paires de bases est observe lorsque la PCR est realisee a partir d'ARN 
de cellules en anoikis. Ce fragment supplemental derive d'un ARN 
messager derive du messager de SHC mais presentant une deletion. 
La sequence de cette deletion est la suivante : 
GTAC GG G AG AGCAC G ACC AC ACCTGG CC AGTATGTG CTCACTG G 
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CTTGCAGAGTGGGCAGCCTAAGCATTTGCTACTGGTGGACCCTGAGGG 
TGTG (SEQ ID NO: 8). 

Cette deletion correspond aux bases 1198 a 1293 de la phase 
ouverte du messager codant pour les formes de 52kDa et 46kDa de la 
5 proteine SHC (Pelicci. G. et al, 1992, Cell, 70, pp93-104). 

Les donnees structurales des domaines SH2 ainsi que la 
litterature indiquent qu'une telle deletion aboutit a la perte de I 'affinite pour 
les phosphotyrosines puisqu'elle englobe les acides amines impliques dans 
les .nteractions avec les tyrosine phosphorylees (Waksman, G et al 1992 
Nature, vol358, pp646-653). Les proteines SHC etant des adapteurs qui 
connectent differents partenaires par leurs domaines SH2 et PTB 
(PhosphoTyrosine Binding domain), cette deletion genere done un dominant 
negatif naturel de SHC que nous appelons ASHC. Les domaines SH2 des 
proteines dont les genes sont sequences etant portes par deux exons il est 
vra.semb.able que la deletion identifier par la methode DATAS correspond a 
un exon alternatif du gene SHC. 

Les sequences proteique et nucleique de ASHC sont les 
representees sur la Figure 17 (SEQ ID NO: 9 et 10). 

Le domaine SH2 de SHC etant implique dans la transduction 
de nombreux signaux impliques dans la proliferation et la viabilite cellulaires 
I'examen de la sequence de ASHC permet d'anticiper ses propriety de 
dominant negatif sur la proteine SHC et sa capacite d'interferer avec 
different signaux cellulaires. 

L'invention concerne egalement cette nouvelle forme epissee 
de SHC, le domaine proteique correspondant a I'epissage, tout anticorps ou 
sonde nucleique permettant sa detection dans un echanti.lon biologique et 
leurs utHisation diagnostique ou therapeutique, par exemple. 

L'invention concerne en particulier tout variant de SHC comprenant au 
moms une deletion correspondant aux bases 1198 a 1293 plus 
particulierement une deletion de la sequence SEQ ID NO: 8. L'invention 
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concerne plus specifiquement le variant ASHC ayant ia sequence SEQ ID 
NO: 9, code par la sequence SEQ ID NO: 10. 

L'invention concerne aussi toute sonde nucleique, oligonucleotide ou 
anticorps permettant d'identifier le variant ASHC ci-dessus, et/ou toute 
5 alteration du rapport SHC/ASHC dans un echantillon biologique. II peut s'agir 
notamment d'une sonde ou oligonucleotide complementaire de tout ou partie 
de la sequence SEQ ID NO: 8, ou d'un anticorps dirige centre le domaine 
proteique code par cette sequence. De telles sondes, oligonucleotides ou 
anticorps permettent de detecter la presence de la forme non epissee (e.g., 

10 SHC) dans un echantillon biologique. 

Les materiels peuvent en outre etre utilises en parallele avec des 
sondes, oligonucleotides et/ou anticorps specifiques de la forme epissee 
(e.g., ASHC), e'est-a-dire correspondant par exemple a la region de jonction 
resultant de I'epissage (localisee autour du nucleotide 1198 de la sequence 

15 SEQ ID NO: 10). 

De tels materiels peuvent etre utilises pour le diagnostic de 
pathologies liees a une immunodepression (cancer, traitement 
immunosuppresseur, SIDA, etc.). 

L'invention concerne aussi tout precede de criblage de molecules 

20 base sur le blocage (i) du domaine episse dans la proteine SHC (notamment 
pour induire un etat de tolerance immunitaire par exemple dans les maladies 
autoimmunes ou les rejets de greffes et les cancers) ou (ii) des gains de 
fonction acquis par la proteine ASHC. 

L'invention concerne en outre I'utilisation therapeutique de ASHC, et 

25 notamment pour le traitement de cellules cancereuses ou de cancers (ex 
vivo ou in vivo) dans lesquels une hyperphosphorylation de la proteine SHC 
peut etre mise en evidence, par exemple. A cet egard, l'invention concerne 
aussi tout vecteur, notamment viral, comprenant une sequence codant pour 
ASHC. II s'agit pr6ferentiellement d'un vecteur capable de transferer des 

30 cellules cancereuses ou en proliferation, telles que des cellules musculaires 
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lisses, des cellules endothelial (restenose), des fibroblastes (fibroses) de 

preference d'origine mammifere. notamment humaine. Comme vecteur viral 

on peut citer notamment des vecteurs adenoviraux. retroviraux. AAV, herpes,' 
etc. 

2. CLONAGE DIFFERENTIEL DES EPISSAGES ALTERNATES ET 
AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc DOUBLE-BRINS (FIGURE 5). 

Les ARNs messagers correspondants aux situations normales 
> (mN) et pathologiques ( mP) sont produjts ains , que ^ ^ 

complementers double brin correspondants (dsN et dsP, par des 
protocoles classiques de biologie moleculaire. Des stroctures de type "R- 
loop" sont alors obtenues en hybridan! mN avec dsP et mP avec dsN dans 
une solution contenan, 70% de formamlde. Les domaines nucleiques 
drtferentiellemen. episses entre la situation N e. P resteron. sous forme 
d'ADN double brin. Les simples brins d'ADN deplaces sont alors traites au 
glyoxa, afin d'eviter le redepiacemen, du brin d'ARN lors du retroi, de ,a 
formamide. Apres retrait de la forroamxfe et du glyoxal puis traitement * la 
RNAseH, nous nous retrouvons avec des strokes de type abeille. les 
ADNs s,mples brin non apparies representant les ailes de I'abeille et le 
doma,ne double brin appareille d'interet representant le corps de I'abeille 
LUMtan d'enzymes qui deg ra dent specifiquement I'ADN simple brin 
comme la nudease S1 ou la Mung Bean nuclease permet Isolation de I'ADN 
reste sous forme double brin qui est ensuite done puis sequence. Cette 
deux,eme technique permet I'obtention directe d'une empreinte ADN double 
bnn du domaine d'interet comparativemen, au premier protocole qui produit 
une empreinte ARN de ce domaine. 

Cette approche a ete realises sur le modele grb2/grb33 dec* 
praoedemrnent. L'ADN double brin de gro2 a ete produi, par amplincafcn 
PCR a pa* de I'ADNc simple brin de grb 2 e. de deux amorces 
nudeo„d,ques correspondent a ,a sequence (1-22, de grb2 e. a la sequence 
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complementaire de (618-639) de grb2. Ce fragment PCR a ete purifie sur 
gel d'agarose, nettoye sur colonne d'affinite (JetQuick, Genomed) et 
quantifie par spectrophotometrie. Dans le meme temps, deux ARNs 
synthetiques correspondant aux phases de lecture de grb2 et de grb33 ont 
5 ete produits a partir de vecteurs plasmidiques comportant les cDNAs de grb2 
ou de grb33 sous controle du promoteur T7, a I'aide du kit RiboMax 
(Promega). Les ARNs ont ete purifies selon les instructions du fournisseur et 
nettoyes sur colomne d'exclusion (Sephadex G50, 5 prime-3 prime). 600 ng 
de I'ADN double brin de grb2 (1-639) ont ete associes avec : 
10 1. 3 |ig d'ARN de grb33 

2. 3 fig d'ARN de grb2 

3. de I'eau 

dans trois reactions differentes, dans le tampon suivant : 

100 mM PIPES (pH 7,2), 35 mM NaCI, 10 mM EDTA, 70% formamide 

15 deionise (Sigma) 

Les echantillons ont ete amenes a 56 °C puis refroidis a 44 °C 
par increment de -0,2 °C toutes les 10 minutes. Ms sont ensuite conserves a 
4 °C. L'analyse sur gel d'agarose revele des modifications de migrations 
dans les puits 1 et 2 par rapport au puits 3 controle (Figure 1 1 A) indiquant la 

20 formation de nouveaux complexes. Les echantillons sont ensuite traites au 
glyoxal deionise (Sigma) (5% v/v ou 1M) pendant 2 h a 12 °C. Les 
complexes sont ensuite precipites a I'ethanol (0,1 M NaCI, 2 volumes 
d'ethanol), laves a I'ethanol 70%, seches puis repris dans de I'eau. lis sont 
enfin traites par la RnaseH (Life Technologies), puis par une enzyme capable 

25 de degrader specifiquement I'ADN simple brin. La nuclease S1 et la 
nuclease " Mung Bean " presentent cette propriete et sont disponibles 
commercialement (Life Technologies, Amersham). De telles digestions 
(incubations de 5 minutes dans les tampons fournis avec les enzymes) ont 
ete analysees sur gel d'agarose (figure 11B). Des digestions significatives 

30 sont uniquement obtenues a partir des complexes issus de la reaction 1 
(grb2/grb33) (figure 11B, puits 7 et 10). Ces digestions semblent plus 
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completes avec la nuclease 81 (pults 7) qu'avec la nuclease ■ Mung Bean " 
(puits 10). Ainsi, la bande correspondant a une taille legerement superieure a 
100 paires de bases (Indiquee par une fleche dans le puits 7) a ete purifiee 
donee dans le vecteur pMos-Blue (Amersham), puis sequencee. Ce 
5 fragment correspond au domaine de 120 paires de bases de grb2, delete 
dans grb33. 

Cette approche peut mainlenant etre effectuee a partir d'une 
population totate d'ARN messager et d'une population totale d'ADNc double 
bnn produite selon les techniques connues de I'homme de metier La 
■ Population d'ARN de la situation de reference est hybridee a la population 
d'ADNc double bnn de la situation test et reciproquement. Apres application 
du protocole decrit oi-dessus, les digestions sont deposees sur gel d'agarose 
afln d'isoler et de purifier les bandes correspondant a des tallies variant entre 
50 et 300 paires de bases. Ces bandes sont ensuite donees dans un 
vecteur (pMos-Blue. Amersham) pour donner lieu a une banque d'inserts 
ennchis en des evenements de differences qualitatives. 

3. CONSTRUCTION DE BANQUES ISSUES DE CRIBLAGES 
DIFFERENTIELS QUALITATIFS. 

Les deux exemples decrits ci-dessus aboutissent aux clonages 
d'ADNc represents de toute ou partie des sequences epissees 
dttferentiellement entre deux situations physiopathologiques donnees. Ces 
ADNc permettent la constitution de banques par insertion de ces ADNc dans 
des vecteurs plasmidiques ou phagiques. Ces banques peuvent etre 
presentees sur des nitres de nitrocellulose ou tout autre support connu de 
I'homme de I'art, tels des chips ou biopuces ou membranes. Ces banques 
peuvent etre conserves au froid, a I'abri de la lumiere. Ces banques une 
fo,s deposees et fixees sur support par les techniques classiques. peuvent 
etre traitees par des composes pour eliminer les bacteries hates qui 
permettent la production des plasmides ou des phages. Ces banques 
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peuvent egalement avantageusement etre constitutes de fragments d'ADNc 
correspondant aux ADNc clones mais prepares par PCR de fagon a ne 
deposer sur filtre que les sequences derivees des evenements d'epissages 
alternatifs. 

5 L'une des caracteristiques et en meme temps l'une des 

originates du criblage differentiel qualitatif est que cette technique aboutit de 
fagon avantageuse non pas a une mais a deux banques differentiates ("paire 
de banque") qui represented I'ensemble des differences quaiitatives qui 
existent entre deux situations donnees. En particulier, Tune des banques 

10 d'epissage differentiel de I'invention represente la signature des qualites de 
la situation physiologique test par rapport a la situation physiologique de 
reference, et I'autre banque represente la signature des qualites de la 
situation physiologique de reference par rapport a la situation physiologique 
test. Ce couple de banques est egalement d6signe paire de banques ou 

15 "banque differentielle d'epissage". 

L'un des apports du Scriblage differentiel qualitatif etant de 
permettre d'evaluer le potentiel toxique d'un compose, comme cela est 
indique dans le chapitre suivant, un: bon exemple de mise en ceuvre de la 
technologie est Tobtention par DATAS de clones d'ADNc correspondant a 

20 des sequences specifiques de cellules HepG2 naTves, d'une part, et traitees 
par de Tethanol, d'autre part. Ces cellules presentent des signes de 
cytotoxicity et une degradation, de leur ADN par fragmentation 
internucleosomale a partir de 18h en presence de 1M d'ethanol. De fagon a 
obtenir des marqueurs precoces de la toxicite ethanolique, les ARN 

25 messagers ont ete prepares a partir de cellules naives et de cellules traitees 
pendant 18h par de I'ethanol a la concentration de 0,1 M. Apres mise en 
oeuvre de la variante de DATAS qui utilise I'ADNc simple brin et la Rnase H, 
les ADNc clones obtenus ont ete amplifies par PCR, soumis a une 
electrophorese sur gel d'agarose et ensuite transferes sur un filtre de nylon 

30 selon les techniques connues de Thomme de Part. Pour chaque ensemble de 
clones specifiques d'une part des differences quaiitatives specifiques de 
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Mm naif et d'autre part des sequences speciflques des cellules traitees par 
I'ethanol. deux repliques identiques de fiKres sont effectuees. Ainsi les 
empremtes de chaque ensemble de clones sont hybridees d'une part avec 
une sonde specifique des cellules non traitees et d'autre part avec une 
5 sonde spicifique des cellules traitees par 0.1M d'«thanol pendant 18h. 

Le profil d'hybridation differential obtenu et presente sur la figure 12 
pennet d'apprecier la qualite de la soustraction effectuee lore de la mise en 
ceuvre de la technique DATAS. Ainsi les clones iseus de I'hybridation de 
I'ARNm de cellules non traitees (NT) avec I'ADNc de cellules traitees (Tr) et 
.o qui doivent corresponds a des differences qualitatives specifiques de la 
station naive hybrident preferentiellement avec une sonde representant la 
population totale des ARN raessagers des cellules non traitees 
Recproquement, les clones issue des produits resistant a la RNase H ayant 
ag, sur les heteroduplex ARN(Tr)/ADNc(NT) hybrident preferentiellement 
is avec une sonde derivee de la population totale des ARN messagers des 
cellules traitees. 

Les deux ensembles de clones specifiques d'une part de la 
situation traitee et d'autre part de la situation non traitee represented un 
exemple de banques de differences qualitatives caracteristiques de deux 
20 etats cellulaires distincts. 

4. UTILISATIONS ET APPORTS DES BANQUES DIFFERENTIELLES 
QUALITATIVES. 



25 



30 



Les possibles d'utilisation des banques differentiates 
d'ep.ssage de Invention sont illustrees notamment sur les Figures 13 a 15. 
Ainsi, ces banques sont utilisables pour : 

4. 1 . devaluation du potentiel toxique d'un compose (figure 13): 

Dans cet exemple, la situation de reference est designee A et la 
station toxique est designee B. Des abaques de toxicite sont obtenues par 
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traitement de la situation A en presence de differentes concentrations d'un 
compose toxique de reference, pendant des periodes variables. A differents 
points les abaques de toxicite, des banques differentielles qualitatives sont 
construites (paires de banque), dans cet exemple, des banques restreintes 
5 rA/cB et rB/cA. Les paires de banque sont avantageusement deposees sur 
un support. Le support est ensuite hybride avec des sondes issues de 
Pechantillon biologique initial traite par differentes doses de composes test : 
Produits X, Y et Z. L'hybridation est revelee et fait apparaTtre le potentiel 
toxique des produits test : dans cet exemple, le produit Z presente une forte 
10 toxicite et le produit Y offre un profil intermediate. La faisabilite de cette 
constitution d'abaques de toxicite est bien illustree par I'exemple de 
constitution de banques de criblage differentiel qualitatif decrit ci-avant et 
mettant en jeu I'ethanol et des cellules HepG2. 

15 4.2. devaluation de I'efficacite d'une composition pharmaceutique 

(figure 14) : 

Dans cet exemple, une paire de banques restreintes selon 
I'invention est realisee a partir d'un modele pathologique B et d*un modele 
sain A (ou du modele pathologique traite avec un produit actif de reference). 

20 Les banques differentielles rA/cB et rB/cA sont, le cas ech6ant, deposees sur 
un support. Cette paire de banque regroupe les differences d'epissage entre 
les deux situations. Cette paire de banque permet d'evaluer I'efficacite d'un 
compose test, c'est-a-dire de determiner sa capacite a gen6rer un profil de 
type "sain" (rA/cB) a partir du profil de type pathologique (rB/cA). Dans cet 

25 exemple, la paire de banque est hybridee avec des sondes preparees a 
partir des situations A et B avec ou sans traitement par le compose test. Le 
profil d'hybridation qui peut etre obtenu est presente sur la figure 14. La 
faisabilite de cette application est la meme que celle de la constitution de 
banques de differences qualitatives caracteristiques de situations saines et 

30 toxiques presentee plus-haut. La situation toxique est remplacee par I'etat 
pathologique et il est possible d'apprecier la capacite d'un compose test a 
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produire une sonde hybndant avec p,us ou moins de preference avec les 
situations de reference ou pathologique. 

4.3. L'anticipation de la reponse d'un echantil.on pathologique a un 
5 traltement (figure 15) : 

Dans cet example, une paira de banque restreinte selon 
I— n est realisee a partir de deux mod«es pathologiques, den, run 
repond a un traitemen. par un produit denne (,e gene P 53 sauvage par 
exemple) : si.ua.ien A ; e. rautre y as, refracteire : simian B. Cote paire de 
o banque (rA/cB ; rB/cA) est d^posee sur un support. 

Ce « e P*» * banque est ensuite utilisee pour determiner la 
sens,b,l,te d'un ecbantillon pathologique (es, a oa meme produit. Pour ceia 
cette paire de banque es, hybndee avec des sondes provenan, de biopsies 
de pa„en,s don, on seuhaite antioiper ,a reponse au traitemen. de reference 
Le profil d-hybrida.ien d'une bicpsia de repondeur e. d'une biopsie de non- 
repondeur est prtsente sur la figure 1 5. 

4.4 ^identification de ligands pour des recepteurs orphelins 

L'activation de recepteurs membranaires ou nucieaires par 
ears l,gands pourrai, induire specifiqueman. des dysregulafions dans 
leprssage de certains ARNs. L'idenfificafion de ces evenements par las 
methodes DATAS de Invention perme, de disposer d'un outi, (marqueurs 
banques. Kite, etc, de suivi d'acfivation de recepteurs. utilisables pour ,a 
recherche demands naturals ou synthetiques de recepteurs. en particulier 
on, e„„, S e,on cette applicafion, des marqueurs associes aux 
dysreguiauons son, identifies e« depose sur des supports. L'ARN tote, de 
^les. (suoexprtman, ,a recepteur a I'etude. traitees ou non par differen.es 

Z7i T r eVou m6s ,es,s ' es ' ex,rait et u,,lis * »™» «* «— 

une hybndafion avec les supports. La mise en evidence d'une hybridation 
avec certarns. voire la totelite des marqueurs deposes sur ,e support indiqua 
,ua la receptee » ,,,ude a ete acfive, e, done que le compos, n/comZ 
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correspondent constitue ou comprend un ligand dudit recepteur. 

4.5 L'identification de cibles d'interet therapeutique : 

Celle-ci se fait par identification de genes dont I'epissage est 
5 modifie dans une pathologie ou dans un modele de pathologie et plus 
precisement Identification des exons ou introns modifies. Cette approche 
doit permettre de donner acces aux sequences qui cedent les domaines 
fonctionnels alteres lors de pathologies ou de tout phenomene 
physiopathologique adressant les phenomenes de proliferation, 

10 differenciation ou apoptose par exemple. 

Un exemple de rapport du criblage differentiel qualitatif a 
ridentification de genes differentiellement episses est fourni par I'application 
de DATAS a un modele d'induction d'apoptose par induction de I'expression 
de la forme sauvage de p53. Ce modele cellulaire a ete etabli par 

is transfection d'un systeme d'expression inductible pour le gene suppresseur 
de tumeur p53. De fagon a identifier les differences qualitatives qui sont 
associes specifiquement a I'apoptose induite par p53, DATAS a ete mise en 
ceuvre a partir des ARN messagers extraits de cellules induites et non 
induites. Pour ces experiences 200ng d'ARN polyA+ et 200ng d'ADNc ont 

20 ete utilises lors de la formation des heteroduplex. Une centaine de clones a 
ete obtenue a partir de chacune des hybridations croisees. L'hybridation de 
ces clones bacteriens puis des fragments d'ADNc qu'ils contiennent avec 
des sondes representatives des ARN messagers totaux des situations de 
depart a permis ridentification de sequences specifiquement exprimees lors 

25 de la forte induction de p53 qui aboutit a la mort cellulaire (figure 16). 

Ces fragments derivent de sequences exoniques ou introniques qui 
modulent la qualite du message present et permettent de proposer les 
domaines fonctionnels auxquels its participent ou qu'ils interrompent comme 
des cibles d'intervention pour induire ou inhiber la mort cellulaire. 

30 Une telle approche aboutit 6galement a la constitution d'une paire de 

banques qui rassemblent des evenements differentiellement episses entre 
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une situation non apoptotique et une situation apoptotique. Cette paire de 
banque peut etre utilisee pour tester le pouvoir hybridant d'une sonde 
derivee d'une autre situation physiopathologique ou d'un traitement 
particulier. Le resultat d'une telle hybridation donnera des indications sur 
5 ('engagement eventuel du programme d'expression genetique de la situation 
testee vers I'apoptose. 

Comme il ressort de la description ci-avant, ('invention conceme 

egalement : 

io - toute sonde nucleique, tout oligonucleotide, tout anticorps 

dirige contre une sequence identifiee par la technique decrite dans la 
presente demande et caracterises en ce qu'ils permettent de caracteriser 
une situation pathologique, 

- ('utilisation des informations issues de I'utilisation des 
is techniques decrites pour la recherche de molecules organiques a visee 
therapeutique par la mise en place de criblages caracterises en ce qu'ils 
cblent des domaines splices differentiellement entre une situation saine et 
une situation pathologique ou bien caracterises en ce qu'ils sont bases sur 
1'inhibttion des gains de fonctions acquis par la proteine resultant d'un 
20 epissage differentiel, 

- I'utilisation des informations issues des techniques decrites 
dans la presente demande pour des applications de therapie genique, 

- I'utilisation d'ADNc transfers par therapie genique 
caracterises en ce qu'ils ont des propriety antagonistes ou agonistes sur 

25 des voies de signalisation cellulaires definies, 

- toute constitution et toute utilisation de banques moleculaires 
d'exons ou d'introns alternatifs a des fins: 

• de diagnostic ou de reactifs commerciaux pour la 

recherche 



30 



. de creer ou de rechercher des molecules, polypeptides, 
acides nucleiques pour application therapeutique. 
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- toute constitution et toute utilisation de banques virtuelles 
informatiques regroupant des exons ou introns alternatifs caracterises en ce 
que ces banques permettent de concevoir des sondes nucleiques ou des 
amorces oligonucleotidiques dans le but de caracteriser les epissages 
5 alternatifs qui differentient deux etats physiopathologiques distincts. 

toute composition pharmaceutique ou diagnostique 
comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables d'interferer avec les produits d'epissage 
alternatifs mis en evidence et clones par les techniques de ('invention, 
io toute composition pharmaceutique ou diagnostique 

comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables de restaurer un epissage representatifs d'une 
situation normale par opposition a Tevenement alternatif caracteristique d'une 
situation pathologique. 

15 

5. DEREGULATIONS DES MECANISMES D'EPISSAGE DES ARNS 
PAR DES AGENTS TOXIQUES. 

Cet exemple montre que les differences de formes et/ou profils 
20 d'epissages peut etre utilisee comme marqueur pour le suivi et/ou la 
detection de toxicite et/ou d'efficacite de composes. 

Les effets d'agents toxiques sur les deregulations d'epissages des 
ARNs a ete teste de la maniere suivante. Des cellules h6patocytaires, 
HepG2, ont ete traitees par differentes doses de trois composes toxiques 
25 (ethanol, camptothecine, PMA (Phorbol 12-Myristate 1 3-Acetate)). Deux 
tests de cytotoxicity (Bleu de Trypan, MTT) ont ete realises a differents 
temps : 4h et 18h pour I'ethanol ; 4h et 18h pour la camptothecine ; 18h et 
40h pour le PMA. 

Le Bleu de Trypan est un colorant qui peut etre incorpore par les 
30 cellules vivantes. Un simple comptage des cellules "bleues" et "blanches" 
sous microscope permet de determiner le pourcentage de cellules vivantes 
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apres traitemen, ou pourosntage de survie. Les points sont effectues en 
triplicates. 

Le test MTT est un test colorimetrique qui mesure la capacite des 
cellules vivantes a convertir les sels solubles de tettazolium (MTT) en un 
5 precipe insoluble de formazan. Ces cristaux de formazan, bleu fence 
peuvent etre dissous et leur concentration determinee par mesure 
d'absorbance a 550 nm. Ainsi, apres ensemencement de plaques 24 puits 
par 150000 cellules sur la nuit, puis traitemen, des cellules par les composes 
toxiques, est ajoute 50 pi de MTT (Sigma) (a 5 mg/ml dans du PBS) La 
to reaction de formation des cristaux de forma Z an s'effectue en 5 h dans 
Hncubateur a C02 (37'C, 5% C02, 95% humidlte). Apras additton de 500 p, 
de solution de solubilisation (Hoi Q.1N dans Isoptopanol-Triton X-100 (10%)) 
les cristaux sont dissous sous agitation et les absorbances mesurees a 550 a' 
660nm. Les points sont effectues en triplicates avec les contrdles (viabilite 
15 mod celiulaire. Wanes) approprife. 

Un test d'apoptose ou mort cellulaire p rogra mmee a egalement ete 
real,se par mesure de la fragmentation d'ADN via I'utilisation d'anticorps anti- 
hrstone et de mesures d'ELISA. Le test utilis* est Cell Death ELISA Plus de 
Roche. 

Les resultats de ces trois tests (Figures 18 A.B.C) ont permis de 
determiner que les doses suivantes : 



25 



30 



• ethanol : 0,1 M 

• camptothecine : 1 ug/ml 

• PMA : 50 ng/ml 

etaient bien inferieures aux IC50s mesurees. 

Les celiu.es He P G2 ont ainsi ete traitees par ces trois composes a ces 
trois doses pendant 4 h pour i'ethanoi et la camptothecine et 18 h pour le 
PMA. Les ARNs messagers ont ete purifies par bides Dynal-Oligo-(dT) a 
partir ^d'ARNs totaux purifies se.on ,e kit Rneasy (Quiagen). Des syntheses 
d ADNc ont ete effectuees a partir de ces ARNs messagers et de la 
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Transcriptase Inverse Superscript (Life Technologies) en utilisant des 
hexameres aleatoires comme amorces. 

Ces premiers brins ont servi de matrices a des reactions 
d'amplification par PCR (94°C 1mn, 55°C 1mn, 72°C 1mn, 30 cycles) a I'aide 
5 des amorces oligonucleotidiques suivantes : 

MACH-a: 

5-TGCCCAAATCAACAAGAGC-3' (SEQ ID NO: 1 1 ) 
10 5'-CCCCTGACAAGCCTGAATA-3' (SEQ ID NO: 12) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de MACH-a (1,2 et 3, amplifiant respectivement 595, 550 
et 343 paires de bases). MACH-a (Caspase-8) est une protease impliquee 
15 dans la mort cellulaire programmee (Boldin et.al., Cell (1996), 85, 803-815). 

BCL-X : 

5' ATGTCTCAGAGCAACCGGGAGCTG 3* (SEQ ID NO: 13) 
20 5' GTGGCTCCATTCACCGCGGGGCTG 3' (SEQ ID NO: 14) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de bcl-X (bcl-XI, bcl-Xs, BCL-Xp) (Boise et al., Cell (1993) 
74, 597-608; U72398 (Genbank)) et doivent amplifier un fragment unique 
25 pour ces trois isoformes de 204 paires de bases. 

FASR: 

5-TGCCAAGAAGGGAAGGAGT-3' (SEQ ID NO: 15) 
30 5-TGTCATGACTCCAGCAATAG-3' (SEQ ID NO: 16) 
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Ces amorces correspondent a des regions communes a certaines 
-soformes de FASR et doivent ampiifier un fragment de 478 paires de bases 
pour la forme sauvage de FasR, 452 pour risoforme A8 et 415 pour 
5 I'isoforme ATM. 

Les resultats rapportes sur la figure 19 indiquent que : 

• la camptothecine induit une diminution de ('expression de risoforme 
MACH-a1 et une augmentation de I'isoforme MACH-cx3. 

• La camptothecine induit I'apparition d'une nouvelle isoforme de bcl-X 
(bande superieure du doublet migrant vers 200 paires de bases). 

• La camptothecine induit une diminution de la forme sauvage du 
recepteur de fas, remplace par une expression d'une isoforme plus courte 
pouvant correspondre a Fas ATM. 

• L'ethanol induit la disparition de bcl-x, remplace par une isoforme 
plus courte. 



10 



• L'ethanol induit une augmentation de la forme tongue, sauvage du 
reoepteur de fas. ceci aux depens de I'isoforme plus courte, 

Ces resultats demontren. que des traitements par des agents toxiques 
a des doses faibles peuvent induire des dysregulations d'epissages 
al.erna.ifs de certains ARNs, ceci de f a5 on specifique. fiden.ifica.ion de ces 
dysregulations au niveau posMtanscriptionnel. nolammen. par Application 
de la .echnologie DATAS perme. ainsi de definir un outil predictif de la 
25 toxicite de molecules. 
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REVEND1CAT1QNS 

1. Procede d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences genetiques qualitatives entre deux 
5 echantillons biologiques, comprenant une etape d'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'un premier echantillon 
biologique avec une population d'ADNc provenant d'un deuxieme echantillon 
biologique. 

io 2. Procede selon la revendication 1 caracterise en ce qu'il comprend : 

(a) Thybridation des ARN provenant du premier echantillon 
(situation test) avec les ADNc provenant du deuxieme echantillon (situation 
de reference); 

(b) Thybridation des ARN provenant du deuxieme echantillon 
is (situation de reference) avec les ADNc provenant du premier echantillon 

(situation test); et 

(c) ('identification et/ou le clonage, a partir des hybrides formes 
en (a) et (b), d'acides nucleiques correspondant a des differences genetiques 
qualitatives. 

20 

3. Procede selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont realisees entre une population d'ARN et des ADNc simple- 
brins et en ce qu'il comprend ^identification et/ou le clonage de regions 
d'ARN non appariees. 

25 

4. Procede selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont realisees entre une population d'ARN et des ADNc double- 
brins et en ce qu'il comprend Tidentification et/ou le clonage de regions 
d'ADN appariees. 

30 

5. Proc6de selon la revendication 1 caracterise en ce qu'il comprend 
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••hybridation entre une population d'ADNc double-brin provenant d'un premier 
echantillon biologique et une population d'ADNc simple-brin provenant d'un 
deuxieme echantillon biologique. 

6. Precede selon I'une des revendications 1 a 5 caracterise en ce que 
I'echantillon biologique est compose de cellules, d'un tissu, d'un organe ou 
d'une biopsie. 



7. Precede selon I'une des revendications 1 a 6 pour ('identification 
io et/ou le clonage d'epissages alternatifs differentiels entre des cellules 

tumorales et des celiuies non-tumorales. 

8. Procede selon I'une des revendications 1 a 6 pour Identification 
et/ou le clonage d'epissages alternatifs differentiels entre des cellules traitees 

15 par un compose test et des cellules non-traitees. 

9. Procede selon I'une des revendications 1 a 6 pour ('identification 
et/ou le clonage d'epissages alternatifs differentiels entre des cellules en 
apoptose et des cellules non-apoptotiques. 

10. Procede selon I'une des revendications 1 a 9 caracterise en ce 
que ('hybridation est realisee en phase liquide. 



20 



11. Precede d'identification et/ou de clonage de regions d'acides 
nucleiques epissees differentiellement entre deux situations physiologiques A 
et B, comprenant : 

(a) la formation d'heteroduplex en phase liquide entre les ARN 
messagers provenant de la situation A et les ADNc provenant de la situation 
B d'une part; 

(b) la formation d'heteroduplex en phase liquide entre les ARN 
messagers provenant de la situation B et les ADNc provenant de la situation 
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A d'autre part; et 

(c) Tidentification et/ou le clonage des regions d'ARN non 
appariees dans les heteroduplex obtenus en (a) et en (b). 

12. Procede d'identification et/ou de clonage de regions d'acides 
nucleiques epissees differentiellement entre deux situations physiologiques A 
et B, comprenant : 

(a) la formation d'heteroduplex entre les ARN messagers 
provenant de la situation A et les ADNc provenant de la situation B d'une 
part, les ARN ou les ADNc etant immobilises sur un support ; 

(b) la formation d'heteroduplex entre les ARN messagers 
provenant de la situation B et les ADNc provenant de la situation A d'autre 
part, les ARN ou les ADNc etant immobilises sur un support ; et 

(c) Tidentification et/ou le clonage des regions d'ARN non 
appariees dans les heteroduplex obtenus en (a) et en (b). 

13. Composition comprenant les acides nucleiques identifies et/ou 
clones selon les precedes des revendications 13 12. 

14. Composition d'acides nucleiques, caracterisee en ce qu'elle 
comprend essentiellement les acides nucleiques representatifs d'alterations 
genetiques qualitatives, notamment des epissages alternatifs distinguant 
deux situations physiologiques d'une cellule ou d'un tissu. 

15. Composition selon les revendications 13 ou 14 caracterisee en ce 
que les acides nucleiques sont clones dans des vecteurs. 

16. Banque d'acides nucleiques comprenant des acides nucleiques 
specifiques d'alterations genetiques qualitatives, notamment d'epissages 
alternatifs distinguant deux situations physiologiques d'une cellule ou d'un 
tissu. 
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17. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque restreinte aux epissages alternatifs qui caracterisent les ARN 
matures. 

18. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque complexe des epissages alternatifs qui caracterisent les 
transcrits. 



15 



19. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque autologue caracteristique des epissages alternatifs entre les 
ARN matures et premessagers d'une situation physiologique. 

20. Banque d'acides nucleiques comprenant des oligonucleotides ou 
des fragments PCR specifiques d'epissages alternatifs distinguant deux 
situations physiologiques. 

i 

21. Banque de microorganismes comprenant des microorganismes 
transforms par des acides nucleiques specifiques d'epissages alternatifs 

20 distinguant deux situations physiologiques d'une cellule ou d'un tissu. 

22. Banque selon les revendications 16 a 21 caracterisee en ce qu'elle 
est deposee sur un support. 

25 23. Kit comprenant un support sur lequel est depose une banque 

selon I'une des revendications 16 a 21. 

24. Kit selon la revendication 23 caracterise en ce qu'il comprend deux 
banques selon I'une des revendications 16 a 21, deposee sur un meme 
30 support ou sur deux supports distincts. 
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25. Kit selon les revendications 23 ou 24 caracterise en ce que le 
support est compose cTun filtre, membrane ou d'une puce. 

26. Utilisation d'une composition selon Tune des revendications 13 a 
5 15 ou d'une banque selon les revendications 16 a 21 pour Identification de 

molecules actives. 



27. Utilisation d'une composition selon Tune des revendications 13 a 
15 ou d'une banque selon les revendications 16 a 21 pour ('identification de 

10 proteines ou domaines proteiques affectes dans une pathologie. 

28. Utilisation d'une composition selon Tune des revendications 13 a 
15 ou d'une banque selon les revendications 16 a 21 pour ('identification de 
domaines antigeniques specifiques de proteines impliquees dans une 

15 pathologie. 

29. Methode d'identification et/ou de production de proteines ou 
domaines proteiques impliques dans une pathologie comprenant : 

(a) I'hybridation des ARN messagers d'un echantillon 
20 pathologique avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux 

en parallele, 

(b) ('identification, dans des hybrides formes, des regions 
correspondant aux differences qualitatives specifiques de I'etat pathologique 
par rapport a l'6tat sain, 

25 (c) ['identification et/ou la production d'une proteine ou domaine 

proteique correspondant a une region identifiee en (b). 

30. Precede d'identification et/ou de clonage de genes suppresseurs 
de tumeurs ou d'epissages au sein de genes suppresseurs de tumeurs, 

30 comprenant : 

(a) I'hybridation des ARN messagers d'un echantillon de tumeur 
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avec les ADNc d'un echantillon sain, ou Inverse, ou les deux en parallels 

(b) I'identification, dans les hybrides formes, des regions 
correspondant aux differences quaiitatives specifiques de I'echantillon 
tumoral par rapport a i'etat sain, 

5 (c) I'identification et/ou la production d'une proteine ou domaine 

proteique correspondant a une region identifiee en (b). 

31. Composition comprenant un compose capable d'interferer avec les 
produits d'epissages a.ternatifs identifies selon le precede des revendications 
io 1 a 12. 



32. Proteine susceptible d'etre identifiee par le procede de la 
revendication 29. 



15 



20 



33. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
kit selon les revendications 23 a 25 pour evaluer la toxicite d'un compose. 

34. Procede ^identification et/ou de clonage d'acides nucleiques 
specifique d'un etat toxique d'un echantillon biologique donne comprenant la 
preparation de banques differences quaiitatives entre les ARN et les ADNc 
de I'echantillon apres ou sans traitement par un compose toxique test et la 
recherche de marqueurs de toxicite specifiques des qualites de I'echantillon 
apres traitement. 



35. Procede de determination ou devaluation de la toxicite d'un 
compose test sur un echantillon bio.ogique donne comprenant .'hybridation : 

- de banques differentielles entre les ADNc et les ARN dudit 
echantillon bio.ogique a I'etat sain et a un ou differents stades de toxicite 
resultant d'un traitement dudit echantillon avec un compose toxique de 

30 reference, avec, 

- une preparation d'acides nucleiques de I'echantillon biologique 
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traite par ledit compose test, et 

- revaluation du potentiel toxique du compose test par analyse 
du degre d'hybridation avec les differentes banques. 

5 36. Proc6d6 selon la revendication 35 caracterise en ce que 

i'echantillon biologique est une culture d'hepatocytes, de cellules epitheliales 
renales ou de cellules endothelials, traitee ou non par un agent toxique, de 
preference I'ethanol. 

10 37. Procede selon la revendication 35 caracterise en ce que 

I'echantillon biologique est une culture de peau traitee ou non par des agents 
toxiques ou irritants. 

38. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
15 kit selon les revendications 23 a 25 pour evaluer I'efficacite d'un compose. 

39. Procede de determination ou devaluation de I'efficacite 
therapeutique d'un compose test sur un echantillon biologique donne 
comprenant I'hybridation : 

20 - de banques differentielles entre les ADNc et les ARN dudit 

echantillon biologique a I'etat sain et a Tetat pathologique avec, 

- une preparation d'acides nucleiques de Techantillon biologique 
traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
25 analyse du degr6 d'hybridation avec les differentes banques. 

40. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
kit selon les revendications 23 a 25 pour evaluer la reponse d'un echantillon 
pathologique a un compose. 

30 

41. Proc6de de determination ou devaluation de la reponse d'un 
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patient a un compose ou traitement test comprenant 1'hybridation : 

- de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-repondeur ou mal-repondeur audit 
compose/traitement, avec, 

- une preparation d'acides nucleiques d'un echantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

42. Procede selon la revendication 41 pour la determination ou 
revaluation de la reponse d'un patient a un compose ou traitement 
antitumoral. 

43. Procede selon la revendication 42 pour la determination ou 
revaluation de la reponse d'un patient a un traitement antitumoral par 
transfert du gene p53 sauvage. 

44. Acide nucleique susceptible d'etre identifie par le procede selon 
les revendications 1 a 12. 



45. Utilisation d'un acide nucleique selon la revendication 44 pou 
detection d'anomalies genetiques dans un echantillon. 

46. Utilisation d'un compose selon la revendication 28 pour 
detection d'une anomalie genetique dans un echantillon. 

47. Anticorps dirige centre une proteine ou un domaine proteique 
que defini dans la revendication 27 ou 28. 



48. Proteine ASHC de sequence SEQ ID NO: 9. 
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49. Sonde nucleique, oligonucleotide ou anticorps permettant d'identifier la 
proteine ASHC selon la revendication 48 ou son acide nucleique, et/ou une 
alteration du rapport SHC/ASHC dans un echantillon biologique. 

5' 

50. Proced6 de criblage caracterise en ce qu'il est base sur le blocage du 
domaine episse dans la proteine SHC ou sur le blocage des gains de fonction 
acquis par la proteine epissee A SHC. 

10 51. Vecteur comprenant une sequence codant pour la proteine ASHC 

selon la revendication 48. 

52. Precede selon les revendications 3, 4 ou 5 caracterise en ce que 
le clonage des acides nucleiques comprend la transcription inverse et/ou 

15 I'amplification au moyen d'amorces aleatoires ou semi-aleatoires, en 
particulier d'amorces de sequence SEQ ID NO: 3 dans laquelle N indique 
que chacune des quatre bases peut etre presente de fagon aleatoire a la 
position indiquee, W, X et Y designent chacun une base determinee, et Z 
designe soit une base determinee, soit un groupe 3-OH. 

20 

53. Oligonucleotide comprenant, dans I'orientation 5' — > 3' : 

- une zone stabilisatrice comprenant 8 a 24 nucleotides determines, 

- une region aleatoire comprenant de 3 a 8 nucleotides, et 

- une zone minimale d'amorgage comprenant 2 a 4 nucleotides 
25 definis. 

54. Oligonucleotide de sequence SEQ ID NO: 3 dans laquelle : 

- N indique que chacune des quatre bases peut etre presente 
de fagon aleatoire a la position indiquee; 

- W, X et Y designent chacun une base determinee, 

30 - Z designe soit une base determinee, soit un groupe 3 f -OH. 
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55. Banque d'ADN genomique caracteris^e en ce qu'elle est 
constitute de fragments d'ADN genomiques de taille inferieure ou egale a 1 
kb environ. 

5 

56. Methode de detection ou de suivi du potentiel toxique et/ou 
therapeutique d ! un compose, basee sur la detection de formes et/ou de 
profits d'epissages induits par ce compost sur un echantillon biologique. 

io 57. Utilisation, comme source de marqueurs de pharmacogenomique, 

(i) de rintervariabilite, entre individus, d'isoformes generees par 6pissage 
alternatif (analyse du spliceome) ou (ii) de modifications d'epissage induites 
par des traitements. 
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FIGURE 13 
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Sequence peptidique de aSHC ISEQ in mo- q) 

l 

MNKLSGGGGR RTRVEGGQLG GEEWTRHGSF VNKPTRGWLH PNDKVMGPGV 
SYLVRYMGCV EVLQSMRALD FNTRTQVTRE AISLVCEAVP GAKGATRRRK 
PCSRPLSSIL GRSNLKFAGM PITLTVSTSS LNLMAADCKQ IIANHHMQSI 
SFASGGDPDT AEYVAYVAKD PVNQRACHIL ECPEGLAQDV ISTIGQAFEL 
RFKQYLRNPP KLVTPHDRMA GFDGSAWDEE EEEPPDHQYY NDFPGKEPPL 
GGVVDMRLRE GAAPGAARPT APNAQTPSHL GATLPVGQPV GGDPEVRKQM 
PPPPPCPGRE LFDDPSYVNV QNLDKARQAV GGAGPPNPAI NGSAPRDL^D 
MKPFEDALRV PPPPQSVSMA EQLRGEPWFH GKLSRREAEA LLQLNGDFLV 
RTKDHRFESV SHLISYHMDN HLPIISAGSE LCLQQPVERKL 

441 

Sequence nuclfiom e de ASHC fSEQ ID no? in) 

•» 

atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg 50 
ccagcttggg ggcgaggagt ggacccgcba cgggagcttt gtcaataagc 100 
ccacgcgggg ctggctgcat cccaacgaca aagtcatggg acccggggtt 150 
tcctacttgg ttcggtacat gggttgtgtg gaggtcctcc agtcaatgcg 200 
tgccctggac ttcaacaccc ggactcaggt caccagggag gccatcagtc 250 
tggtgtgtga ggctgtgccg ggtgctaagg gggcgacaag gaggagaaag 300 
ccctgtagcc gcccgctcag ctctatcotg gggaggagta acctgaaatt 350 
tgctggaatg ccaatcactc tcaccgtctc caccagcagc ctcaacctca 400 
tggccgcaga ctgcaaacag atcatcgcca accaccacat gcaatctatc 450 
tcatttgcat ccggcgggga tccggacaca gccgagtatg tcgcctatgt 500 
tgccaaagac cctgtgaatc agagagcctg ccacattctg gagtgtcccg 550 
aagggcttgc ccaggatgtc atcagcacca ttggccaggc cttcgagttg 600 
cgcttcaaac aatacctcag gaacccaccc aaactggtca cccctcatga 650 
caggatggct ggctttgatg gctcagcatg ggatgaggag gaggaagagc 700 
cacctgacca tcagtactat aatgacttcc cggggaagga accccccttg 750 
gggggggtgg tagacatgag gcttcgggaa ggagccgctc caggggctgc 800 
tcgacccact gcacccaatg cccagacccc cagccacttg ggagctacat 850 
tgcctgtagg acagcctgtt gggggagatc cagaagtccg caaacagatg 900 
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ccacctccac caccctgtcc aggcagagag ctttttgatg atccctccta 950 

tgtcaacgtc cagaacctag acaaggcccg gcaagcagtg ggtggtgctg 1000 

ggccccccaa tcctgctatc aatggcagtg caccccggga cctgtttgac 1050 

atgaagccct tcgaagatgc tcttcgggtg cctccacctc cccagtcggt 1100 

gtccatggct gagcagctcc gaggggagcc ctggttccat gggaagctga 1150 

gccggcggga ggctgaggca ctgctgcagc tcaatgggga cttcttggtt 1200 

cggactaagg atcaccgctt tgaaagtgtc agtcacctta tcagctacca 1250 

catggacaat cacttgccca tcatctctgc gggcagcgaa ctgtgtctac 1300 
agcaacctgt ggagcggaaa ctgtga 1326 
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5 50 Jig/ml 




0 0.01 0.05 0.5 5 50 

Test ELISA de fragmentation de I'ADN 

Facteur d'enrichissement 



■ l8h 

»40h 

Mg/ml 




18h 



0.01 0.05 0.5 5 



50 



pg/ml 
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FEU1LLE DE ^EMPLACEMENT (REGLE 26) 
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1 



LISTE DE SEQUENCES 
<110> EXONHIT THERAPEUTICS SA 
<12 0> CRIBLAGE DIFFERENTIEL QUALITATIF 
<130> B3898B - PB/KM 

<140> 
<141> 

<150> 9802997 
<151> 1998-03-11 

<160> 16 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 1 

gagaagcgtt atnnnnnnna ggn 

<210> 2 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 2 

gagaagcgtt atnnnnnnnn tccc 

<210> 3 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 



23 



24 
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<223> Description de la sequence artif icielle : OLIGO 
<400> 3 

gagaagcgtt atnnnnnnnn nnn 23 

<210> 4 

<211> 20 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 

<400> 4 

gagaagcgtt atnnnnncca 20 

<210> 5 
<211> 66 
<212> ADN 

<213> Homo sapiens 
<400> 5 

ccacacctgg ccagtatgtg ctcactggct tgcagagtgg gcagccagcc taagcatttg 60 
cactgg i 66 

<210> 6 ' 
<211> 23 \ 
<2\2> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 6 

gggacctgtt tgacatgaag ccc 23 
<210> 7 

<211> 22 ; 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 7 

» 

cagtttccgc tccacaggtt gc 22 
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<210> 8 
<211> 96 
<212> ADN 

<213> Homo sapiens 



<400> 8 

gtacgggaga gcacgaccac acctggccag 
cctaagcatt tgctactggt ggaccctgag 

<210> 9 
<211> 441 
<212> PRT 

<213> Homo sapiens 



tatgtgctca ctggcttgca gagtgggcag 60 
ggtgtg 96 



<400> 9 

Met Asn Lys Leu Ser Gly Gly Gly Gly Arg Arg Thr Arg Val Glu Gly 
1 5 10 15 

Gly Gin Leu Gly Gly Glu Glu Trp Thr Arg His Gly Ser Phe Val Asn 
20 25 30 

Lys Pro Thr Arg Gly Trp Leu His Pro Asn Asp Lys Val Met Gly Pro 
35 40 45 

Gly Val Ser Tyr Leu Val Arg Tyr Met Gly Cys Val Glu Val Leu Gin 
50 55 60 

Ser Met Arg Ala Leu Asp Phe Asn Thr Arg Thr Gin Val Thr Arq Glu 
65 70 75 80 

Ala lie Ser Leu Val Cys Glu Ala Val Pro Gly Ala Lys Gly Ala Thr 
85 90 95 

Arg Arg Arg Lys Pro Cys Ser Arg Pro Leu Ser Ser He Leu Gly Arg 
100 los . X10 

Ser Asn Leu Lys Phe Ala Gly Met Pro He Thr Leu Thr Val Ser Thr 
115 120 125 

Ser Ser Leu Asn Leu Met Ala Ala Asp Cys Lys Gin He lie Ala Asn 
130 135 140 

His His Met Gin Ser He Ser Phe Ala Ser Gly Gly Asp Pro Asp Thr 

150 155 160 

Ala Glu Tyr Val Ala Tyr Val Ala Lys Asp Pro Val Asn Gin Arg Ala 
165 170 175 

Cys His He Leu Glu Cys Pro Glu Gly Leu Ala Gin Asp Val He Ser 
180 185 190 

Thr He Gly Gin Ala Phe Glu Leu Arg Phe Lys Gin Tyr Leu Arg Asn 
195 200 205 
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Pro Pro Lys Leu Val Thr Pro His Asp Arg Met Ala Gly Phe Asp Gly 
210 215 220 

Ser Ala Trp Asp Glu Glu Glu Glu Glu Pro Pro Asp His Gin Tyr Tyr 
225 230 235 240 

Asn Asp Phe Pro Gly Lys Glu Pro Pro Leu Gly Gly Val Val Asp Met 
245 250 255 

Arg Leu Arg Glu Gly Ala Ala Pro Gly Ala Ala Arg Pro Thr Ala Pro 
260 265 270 

Asn Ala Gin Thr Pro Ser His Leu Gly Ala Thr Leu Pro Val Gly Gin 
275 280 285 

Pro Val Gly Gly Asp Pro Glu Val Arg Lys Gin Met Pro Pro Pro Pro 
290 295 300 

Pro Cys Pro Gly Arg Glu Leu Phe Asp Asp Pro Ser Tyr Val Asn Val 
305 310 315 320 

Gin Asn Leu Asp Lys Ala Arg Gin Ala Val Gly Gly Ala Gly Pro Pro 
325 330 335 

Asn Pro Ala lie Asn Gly Ser Ala Pro Arg Asp Leu Phe Asp Met Lys 
340 345 350 

Pro Phe Glu Asp Ala Leu Arg Val Pro Pro Pro Pro Gin Ser Val Ser 
355 360 365 

Met Ala Glu Gin Leu Arg Gly Glu Pro Trp Phe His Gly Lys Leu Ser 
370 375 380 

Arg Arg Glu Ala Glu Ala Leu Leu Gin Leu Asn Gly Asp Phe Leu Val 
385 390 395 400 

Arg Thr Lys Asp His Arg Phe Glu Ser Val Ser His Leu lie Ser Tyr 
405 410 415 

His Met Asp Asn His Leu Pro lie lie Ser Ala Gly Ser Glu Leu Cys 
420 425 430 

Leu Gin Gin Pro Val Glu Arg Lys Leu 
435 440 

<210> 10 

<211> 1326 

<212> ADN 

<213> Homo sapiens 

<400> 10 

atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg ccagcttggg 60 
ggcgaggagt ggacccgcca cgggagcttt gtcaataagc ccacgcgggg ctggctgcat 120 
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cccaacgaca aagtcatggg acccggggtt tcctacttgg ttcggtacat gggttgtgtg 180 
gaggtcctcc agtcaatgcg tgccctggac ttcaacaccc ggactcaggt caccagggag 240 
gccatcagtc tggtgtgtga ggctgtgccg ggtgctaagg gggcgacaag gaggagaaag 300 
ccctgtagcc gcccgctcag ctctatcctg gggaggagta acctgaaatt tgctggaatg 360 
ccaatcactc tcaccgtctc caccagcagc ctcaacctca tggccgcaga ctgcaaacag 420 
atcatcgcca accaccacat gcaatctatc tcatttgcat ccggcgggga tccggacaca 480 
gccgagtatg tcgcctatgt tgccaaagac cctgtgaatc agagagcctg ccacattctg 54 0 
gagtgtcccg aagggcttgc ccaggatgtc atcagcacca ttggccaggc cttcgagttg 600 
cgcttcaaac aatacctcag gaacccaccc aaactggtca cccctcatga caggatggct 660 
ggctttgatg gctcagcatg ggatgaggag gaggaagagc cacctgacca tcagtactat 72 0 
aatgacttcc cggggaagga accccccttg gggggggtgg tagacatgag gcttcgggaa 78 0 
ggagccgctc caggggctgc tcgacccact gcacccaatg cccagacccc cagccacttg 840 
ggagctacat tgcctgtagg acagcctgtt gggggagatc cagaagtccg caaacagatg 900 
ccacctccac caccctgtcc aggcagagag ctttttgatg atccctccta tgtcaacgtc 960 
cagaacctag acaaggcccg gcaagcagtg ggtggtgctg ggccccccaa tcctgctatc 102 0 
aatggcagtg caccccggga cctgtttgac atgaagccct tcgaagatgc tcttcgggtg 1080 
cctccacctc cccagtcggt gtccatggct gagcagctcc gaggggagcc ctggttccat 1140 
gggaagctga gccggcggga ggctgaggca ctgctgcagc tcaatgggga cttcttggtt 1200 
cggactaagg atcaccgctt tgaaagtgtc agtcacctta tcagctacca catggacaat 1260 
cacttgccca tcatctctgc gggcagcgaa ctgtgtctac agcaacctgt ggagcggaaa 1320 



<210> 11 
<211> 19 
<212> ADN 

<213> Sequence artificielle 



i \ 1326 



<220> | 
<223> Description de la sequence artificielle: OLIGO 

<400> 11 

tgcccaaatc aacaagagc 
<210> 12 

<211> 19 ' 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 12 

cccctgacaa gcctgaata 

<210> 13 
<211> 24 
<212> ADN 



19 



19 
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<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 13 

atgtctcaga gcaaccggga gctg 

<210> 14 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 14 

gtggctccat tcaccgcggg gctg 

<210> 15 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 15 

tgccaagaag ggaaggagt 

<210> 16 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 16 

tgtcatgact ccagcaatag 



artificielle: OLIGO 



24 



artificielle: OLIGO 



24 



artificielle : OLIGO 



19 



artificielle : OLIGO 
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Form PCT/ISA/210 (patent family annex) (July 1992) 



BNSDOCID: <WO 9946403A1_I_> 



INTERNATIONAL SEARCH REPORT 

Information on patent family members 



Patent document 
cited in search report 



Publication 
date 



WO 9527052 



Int 



ittonal Application No 

PCT/FR 99/00547 



Patent family 
member(s) 



12-10-1995 



Publication 
date 



AU 
CA 
EP 
JP 
ZA 



2237395 A 
2186854 A 
0775202 A 
9511400 T 
9502639 A 



23-10-1995 
12-10-1995 
28-05-1997 
18-11-1997 
02-01-1996 



W0 9626272 



29-08-1996 



AU 
CA 
EP 



5172596 A 
2212846 A 
0812356 A 



11-09-1996 
29-08-1996 
17-12-1997 



WO 9802576 
FR 2664287 



22-01-1998 



AU 3494297 A 



09-02-1998 



10-01-1992 



NONE 



EP 0330781 A 06-09-1989 



JP 
CA 
DE 
DE 



1218590 A 
1313151 A 
3855076 D 
3855076 T 



31-08-1989 
26-01-1993 
11-04-1996 
17-10-1996 



EP 0709397 A 01-05-1996 



US 
CA 
JP 
US 



5688918 A 
2150994 A 
8081500 A 
5726024 A 



18-11-1997 
15-12-1995 
26-03-1996 
10-03-1998 



WO 9412631 A 09-06-1994 



AT 

CA 

CA 

DE 

DE 

EP 

EP 

WO 

JP 

JP 

JP 

US 

US 



136940 
2139410 
2149635 



69302276 D 



69302276 
0651822 
0672130 
9402633 



2800850 B 



8500731 
8506801 
5830646 



5879898 A 



15-05- 
03-02- 

09- 06- 
23-05- 

19- 09- 

10- 05- 

20- 09- 
03-02- 

21- 09- 
30-01- 
23-07- 
03-11- 
09-03- 



1996 
1994 
1994 
1996 
1996 
1995 
1995 
1994 
1998 
1996 
1996 
1998 
1999 



W0 9746679 A 
EP 0806478 A 



11- 12-1997 

12- 11-1997 



AU 



3300397 A 



05-01-1998 



US 
US 



5747650 A 
5726024 A 



05-05-1998 
10-03-1998 



W0 9630512 



03-10-1996 



FR 
AU 
BR 

CA 
CZ 
EP 
HU 
JP 
NO 
SK 
ZA 



2732348 
5402096 
9607928 
2214451 
9703080 
0817845 
9801221 
11503011 
974449 
131197 
9602506 



04-10- 
16-10- 
09-06- 
03-10- 
14-01- 
14-01- 
28-08- 
23-03- 
26-09- 
06-05- 
01-10- 



-1996 
-1996 
1998 
1996 
1998 
1998 
1998 
1999 
1997 
1998 
1996 



US 5679541 



21-10-1997 



NONE 



WO 9704092 A 06-02-1997 

Form PCT/ISA/2 1 0 (patent family annex) {July t992) ' 



FR 



2736915 A 



24-01-1997 



BNSDOCID: <WO 9946403A1 I > 



page 1 of 2 



INTERNATIONAL SEARCH REPORT 

Information on patent family members 


n 1 

Inte ional Application No 

PCT/FR 99/00547 


Patent document 
cited in search report 


Publication 
date 


Patent family 
member(s) 


Publication 
date 



WO 9704092 A AU 6618696 A 18-02-1997 

CA 2224468 A 06-02-1997 

CZ 9800144 A 15-04-1998 

EP 0839194 A 06-05-1998 

NO 980203 A 10-03-1998 

SK 6398 A 09-09-1998 



EP 0791660 A 27-08-1997 JP 10000100 A 06-01-1998 



Foim PCT/ISA/210 (patent farndy annex) (July 1992) 
BNSDOCID: <WO 9946403A1 _!_> 



page 2 of 2 



•RAPPORT DE RECHERCHE INTERNATIONALE 



frfiTTi&iTBSr DE " DEMANOE 



CX nde Internationale No 

PCT/FR 99/00547 



Selon .a classification intemationale des brevets (CIB) ou a la fois selon la classification nat ion^ at la ClB 
B. OOMAINES SUR L ESQ U ELS LA RECHERCHE A PORTE 

Documentation min^ale consume (systeme de classification suivi des symboles de Cassement, 



Documentation consultee autre que la documentation minimale dans la 



mesure ou ces documents relevent des domaines sur lesquels a porta la recherche 



Base de donnees electronique consultee au cours de la recherche 



intemationale (nom de la base de donnees, et si realisable, termes de recherche utilises) 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 



Identification des documents cites, avec, le cas echeant, ( indication des 



passages pertinents 



x 

Y 



M??rT5*? T L E L AL: GENE THERAPY ADVANCES: 
UTILIZATION OF ALTERNATIVE SPLICING AS A 
CONTROL ELEMENT IN THE CHIMERIC 
ENZYME/PRODRUG THERAPY (CEPT) APPROACH TO 
PRIMARY AND METASTATIC TUMORS 
JOURNAL OF CLINICAL LIGAND ASSAY 
vol. 19, no. 1, 1996, pages 80-84 
XP002038774 ' 
voir le document en entier 

WO 95 27052 A (UNIV MARYLAND) 
12 octobre 1995 

voir abrege; revendications 1-16 

-/-- 



no. des revendications visees 

1,5-8, 
13,14, 
26-28, 
31,32, 
38-42 , 
44-47 



14,15, 

26,27 

38,39,41 



| X| Voir la sul,e du C pour la (in de la lisle des documents 



' Categories speciales de documents cites: 

"A" document definissant Tetat general de la technique, non 
considere comme particulierement pertinent 

E " d o,?^f^ an » ri ! U . r ' mais pubM a la da,e de <**t*t international 
ou apres cette date 

V 6 SSS!V^1SK1 ]et Hl. un doute , sur une ^vindication de 
prronte ou cite pour determiner la date de publication d une 
autre citation ou pour une raison speciale (telle qu'indiquee) 

"O" document se referant a une divulgation orale, a un usaae a 
une exposition ou tous autres moyens ' 

P " d ^ m ® nt publ '® . avant 13 date de d6 P ot international, mais 
posteneurement a la d ate de priorite revendtquee 

Date a laquelle la recherche intemationale a ete effectivement achevee 

1 juillet 1999 



|X | Les documents de families de brevets sont indiques en annexe 



T" document ufterieur publie apres la date de depot international ou la 
date de pnorrte et n appartenenant pas a I etat de la 
technique pertinent, mais cite pour comprendre le principe 
ou la theorie constituant la base de I'invention 

• X" document particulierement pertinent; I'inven tion revendiquee ne peut 
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voir feuille supplemental re 



a trouve plusieurs inventions dans la demande Internationale, a 
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L 4 administration chargee de la recherche Internationale a trouve plusieurs 
(groupes d') inventions dans la demande Internationale, a savoir: 

1. Revendi cations: 1-47, 52-57 (complet) 

Des procedes d' identification et/ou de clonage de regions d' acides 
nuclei ques representatives de differences qualitatives entre deux 
echantillons (patho)biologiques, des oligonucleotides bons pour le 
clonage de ces acides nucleiques, des acides nucleiques identifies 
par ces procedes, des compositions et des banques comprenant ces 
acides nucleiques, des kits comprenant ces banques, Tutilisation 
de ces acides nucleiques, compositions ou banques, un procede d' 
identification et/ou de production de proteines reliees a une 
condition pathologique, une proteine identifiee ou produite par ce 
procede, un anticorps dirige contre cette proteine, un procede d* 
identification et/ou de clonage de genes suppresseurs de tumeurs, 
un procede de determination de la toxicite d'un compose, un procede 
de determination de I'efficacite therapeutique d'un compose, et un 
procede de determination de la reponse d'un patient a un compose. 

2. Revendi cations: 48-51 (complet) 

Une proteine de sequences SEQ ID N0:9, une sonde nuclei que ou 
anticorps permettant d' identifier cette proteine, un procede de 
criblage, et un vecteur comprenant une sequence codant pour cette 
proteine. 
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